Η Επιστήμη των Δεδομένων έχει αναδειχθεί τα τελευταία χρόνια ως ένα πολύ σημαντικό επιστημονικό πεδίο που έχει ως αντικείμενο την κατανόηση πολύπλοκων συστημάτων και την καθοδήγηση στη λήψη αποφάσεων μέσω της ανάλυσης δεδομένων. Συνθέτει στοιχεία από πολλούς άλλους βασικούς επιστημονικούς κλάδους όπως η πληροφορική, η επιστήμη των υπολογιστών, η στατιστική και η τεχνητή νοημοσύνη.
Η διαδικασία που ακολουθείται σε μια εφαρμογή της Επιστήμης των Δεδομένων ξεκινά από ένα ερώτημα που θέλουμε να απαντήσουμε. Στη συνέχεια πρέπει να προσδιοριστούν οι τύποι των δεδομένων που θα μας βοηθούσαν στην απάντηση αυτού του ερωτήματος, καθώς και η διαθεσιμότητά τους. Έχοντας τα δεδομένα διαθέσιμα, θα πρέπει αρχικά να απεικονιστούν και να γίνει μια πρώτη προσπάθεια αναγνώρισης μοτίβων. Το επόμενο στάδιο αφορά στην κατασκευή του κατάλληλου υποδείγματος και στο ταίριασμα (ή εκτίμηση των παραμέτρων του) στα δεδομένα. Στο τελικό στάδιο, τα αποτελέσματα της ανάλυσης θα πρέπει να παρουσιαστούν με τον κατάλληλο τρόπο (οπτικοποίηση) ώστε να αναδεικνύονται τα κεντρικά συμπεράσματα.
Σε αυτό το σεμινάριο ξεκινάμε με μια εισαγωγή στις βασικές έννοιες της Επιστήμης των Δεδομένων. Στη συνέχεια εμβαθύνουμε στα στατιστικά εργαλεία, στον προγραμματισμό και σε ορισμένα βασικά θέματα τεχνητής νοημοσύνης. Στο πλαίσιο του σεμιναρίου ο φοιτητής έρχεται σε μια πρώτη επαφή με τις γλώσσες προγραμματισμού R και SQL.
ΜΑΘΗΣΙΑΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ/ΣΚΟΠΙΜΟΤΗΤΑ
1ο Μάθημα: Εισαγωγή στη Στατιστική για Ανάλυση Δεδομένων
Περιγραφική Στατιστική – Descriptive Statistics
Τύποι Δεδομένων. Περιγραφή δεδομένων με γραφήματα και πίνακες. Παρουσίαση των βασικών στατιστικών μέτρων για τη περιγραφή δεδομένων.
Βασικά Στοιχεία Πιθανοτήτων –Basic Probability
Ιδιότητες της Πιθανότητας, ενδεχόμενα, ανεξαρτησία ενδεχομένων, δεσμευμένη πιθανότητα, θεώρημα Bayes.
2ο Μάθημα: Τυχαίες Μεταβλητές
Βασικά Στοιχεία Τυχαίων Μεταβλητών
Τι είναι οι τυχαίες μεταβλητές, Διακριτές και Συνεχείς τυχαίες μεταβλητές, Κατανομές τυχαίων μεταβλητών, μέτρα και ιδιότητες τυχαίων μεταβλητών (μέσος, διασπορά, …).
Είδη τυχαίων μεταβλητών
Κατανομές Bernoulli, διωνυμικες, Poisson. Κανονικές τυχαίες μεταβλητές. Ο Νόμος των Μεγάλων Αριθμών και το Κεντρικό Οριακό Θεώρημα.
3ο Μάθημα: Εκτιμητική και Στατιστική Συμπερασματολογία
Δειγματοληψία και Διαστήματα Εμπιστοσύνης
Μέθοδοι δειγματοληψίας. Σημειακή εκτίμηση. Εκτιμητές. Διαστήματα εμπιστοσύνης.
Έλεγχος Υποθέσεων
Η έννοια του Ελέγχου Υποθέσεων. Πόσο ισχυρά συμπεράσματα βγάζουμε; Πώς καθορίζεται η Μηδενική και η Εναλλακτική υπόθεση; Τύποι σφαλμάτων που μπορεί να προκύψει (σφάλματα τύπου Ι και ΙΙ).
4ο Μάθημα: Εισαγωγή στη γλώσσα R για την Επιστήμη των Δεδομένων.
Ορισμένοι Βασικοί Έλεγχοι
Έλεγχοι για τους μέσους, τις αναλογίες και τη διαφορά μέσων δύο πληθυσμών. Ο έλεγχος Χ2 για ανεξαρτησία.
Βασικά χαρακτηριστικά της R
Ποιά είναι η γλώσσα R. Πώς την εγκαθιστούμε και πώς τη χρησιμοποιούμε.
5ο Μάθημα: Χρήσιμες δομές δεδομένων της R
Γράφοντας τον πρώτο μας κώδικα
Η δομή των εντολών της R. Βασικοί τύποι δεδομένων. Μεταβλητές.
Διανύσματα και Πίνακες στην R
Δημιουργία, ονομασία. Επιλογή στοιχείων από διανύσματα. Βασικές πράξεις χρησιμοποιώντας πίνακες. Η πρώτη μας εφαρμογή.
Factors, Data Frames και Lists
Δημιουργία, επιλογή και σύγκριση κατηγορικών δεδομένων με τη χρήση Factors. Αποθήκευση πινάκων δεδομένων σε Data Frames. Επιλογή στοιχείων από ένα Data Frame και μετατροπή σε Πίνακα. Αποθήκευση δεδομένων διαφορετικών τύπων σε λίστες.
Βασικά πακέτα γραφικών στην R
Δημιουργία γραφημάτων και οπτικοποίηση δεδομένων.
6ο Μάθημα: Στοιχεία της Επιστήμης των Δεδομένων.
Οι διαδικασίες στην Επιστήμη των Δεδομένων
Η προσέγγιση και οι βασικές αρχές της Επιστήμης των Δεδομένων. Η διαδικασία που ακολουθούμε στην Επιστήμη των Δεδομένων.
Εισαγωγή και ανάγνωση Δεδομένων στην R
Οι βασικές εντολές ανάγνωσης δεδομένων.
Εισαγωγή στη Μηχανική Μάθηση (Machine Learning)
Πιθανότητες και Στατιστική στην Επιστήμη των Δεδομένων
Εφαρμογή σε δεδομένα της εύρεσης διαστημάτων εμπιστοσύνης και του ελέγχου υποθέσεων. Η έννοια της συσχέτισης.
Προσομοιώσεις
Δεδομένα που προκύπτουν από προσομοιώσεις. Προσομοιώσεις Monte-Carlo. Re-sampling δεδομένων.
7ο Μάθημα: Δουλεύοντας με Δεδομένα.
Προετοιμασία Δεδομένων και Data Ingestion
Τα βασικά επιλογής δεδομένων. Η σημασία του ελέγχου και «ξεκαθαρίσματος» των δεδομένων (data cleaning).
Εισαγωγή Δεδομένων από ιστοσελίδες
Χρήση πακέτων της R. Έλεγχος, καθάρισμα και μετασχηματισμός δεδομένων (data munging). Εφαρμογή με πραγματικές ιστοσελίδες.
8ο Μάθημα: Εισαγωγή στη Γραμμική Παλινδρόμηση
Το Απλό Γραμμικό Υπόδειγμα
Απλή γραμμική παλινδρόμηση. Βασικές υποθέσεις. Μέθοδοι εκτίμησης. Ερμηνεία των παραμέτρων του υποδείγματος. Ιδιότητες των εκτιμητών
9ο Μάθημα: Ανάλυση Πολλαπλής Παλινδρόμησης
Βασικές υποθέσεις και ερμηνεία των παραμέτρων. Αμεροληψία και αποτελεσματικότητα των εκτιμητών ελαχίστων τετραγώνων. Έλεγχος υποθέσεων. Πολυσυγγραμμικότητα. Omitted Variable Bias. Συνέπεια και ασυμπτωτική αποτελεσματικότητα των εκτιμητών ελαχίστων τετραγώνων.
Ετεροσκεδαστικότητα
Συνέπειες. Έλεγχοι ετεροσκεδαστικότητας. Επίλυση του προβλήματος.
10ο Μάθημα: Ειδικά Θέματα Παλινδρόμησης
Binary (Dummy) Variables
Όταν κάποιοι από τους regressors είναι Ερμηνεία. Η περίπτωση που η εκξαρτημένη μεταβλητή είναι Binary (το γραμμικό υπόδειγμα πιθανότητας).
Τα υποδείγματα Probit και Logit
11ο Μάθημα: Αρχές Ανάλυσης Δεδομένων Χρονοσειρών
Στάσιμες Στοχαστικές Ανελίξεις
Αυτοσυσχέτιση. Ασθενώς Εξαρτημένες Χρονοσειρές
Ορισμένοι Βασικοί Τύποι Ανελίξεων
Ανιλίξεις κινητού μέσου (MA(q)). Αυτοπαλίνδρομες ανελίξεις (AR(p)). Ανελίξεις ARMA(p,q). Ο τελεστής
Ανελίξεις Μοναδιαίας Ρίζας
Ιδιότητες. Έλεγχοι ύπαρξης μοναδιαίας ρίζας.
Προσομοιώσεις Ανελίξεων ARIMA(p,d,q) και έλεγχοι μοναδιαίας ρίζας στην R
12ο Μάθημα: Αρχές Machine Learning
Εισαγωγή στο Supervised Learning
Βασικές αρχές του Supervised Learning. Βασικές διαφορές με το Unsupervised Learning. Απλά μοντέλα Machine Learning στην R.
Βελτιώνοντας ένα μοντέλο Supervised Learning
Η διαδικασία επιλογής χαρακτηριστικών. Τα προβλήματα της υπερ-παραμετροποίησης (over-parametrization) και τις ανάλυσης φαινομένων σε πολλές διαστάσεις (curse of dimensionality). Τεχνικές για αντιμετώπιση αυτών των προβλημάτων (reguralization, dimensionality reduction).
13ο Μάθημα: Αλγόριθμοι Ταξινόμησης
Linear Discriminant Analysis (LDA)
Classification and Regression Trees (CART).
k-Nearest Neighbors (kNN).
Support Vector Machines (SVM) with a linear kernel.
Random Forests (RF)
Unsupervised Learning στην R
Μέθοδοι Clustering και Εφαρμογή στην R
Recommender Systems και Εφαρμογή στην R
14ο Μάθημα: Εισαγωγή στις Βάσεις Δεδομένων
Εισαγωγή στον SQL server
Τύποι δεδομένων και η λέξη NULL. Queries. Queries σε πολλαπλούς πίνακες με την εντολή JOIN. Τελεστές. Subqueries και η εντολή Τροποποίηση δεδομένων.
Επικοινωνώντας με τον SQL server – Βάσεις Δεδομένων και η R
Η παρακολούθηση γίνεται αποκλειστικά από το Διαδίκτυο μέσω απλού εκπαιδευτικού λογισμικού (πλατφόρμα ασύγχρονης τηλεκπαίδευσης), παρέχεται ψηφιακό εκπαιδευτικό υλικό και συνεχή εκπαιδευτική υποστήριξη. Από τη στιγμή που ένας υποψήφιος γίνεται δεκτός στο Πρόγραμμα, δημιουργείται λογαριασμός χρήστη στην πλατφόρμα τηλεκπαίδευσης, στον οποίο δίνεται πρόσβαση στην εκπαιδευτική ενότητα της επιλογής του. Στα πλαίσια της κάθε εκπαιδευτικής ενότητας γίνεται ανάρτηση σε εβδομαδιαία βάση στην πλατφόρμα τηλεκπαίδευσης ηλεκτρονικού εκπαιδευτικού υλικού του υπεύθυνου διδάσκοντα. Το εκπαιδευτικό υλικό περιλαμβάνει ηλεκτρονικές σημειώσεις με θεωρία και παραδείγματα τα οποία είναι σε μορφή pdf με δυνατότητα αποθήκευσης και εκτύπωσης, ώστε να είναι εφικτή η μελέτη και offline. Ο εκπαιδευόμενος έχει πρόσβαση, οποιαδήποτε στιγμή και από οπουδήποτε έχει σύνδεση Internet, σε όλες τις δραστηριότητες, πηγές πληροφοριών και ανακοινώσεις του εκάστοτε μαθήματος και του κοινοποιούνται στοιχεία επικοινωνίας με τον διδάσκοντα για επίλυση αποριών. Οι συμμετέχοντες πρέπει να:
ΠΡΟΑΠΑΙΤΟΥΜΕΝΑ
Οι συμμετέχοντες πρέπει να διαθέτουν πρόσβαση στο διαδίκτυο, βασικές γνώσεις χειρισμού ηλεκτρονικών υπολογιστών καθώς και προσωπικό λογαριασμό e-mail.
ΔΙΑΔΙΚΑΣΙΑ ΤΕΛΙΚΗΣ ΕΞΕΤΑΣΗΣ
H εξεταστική διαδικασία πραγματοποιείται εξ αποστάσεως μέσα από την πλατφόρμα e-learning με τη συμπλήρωση τεστ επίδοσης (ερωτήσεων πολλαπλής επιλογής) το οποίο είναι διαθέσιμο σε συγκεκριμένες ημερομηνίες. Υπάρχει η δυνατότητα να προγραμματιστεί σε συνεννόηση με τον εκπαιδευόμενο η εκπρόθεσμη συμμετοχή του στην τελική εξέταση με την προϋπόθεση ότι δεν έχει παρέλθει διάστημα πάνω από ένα έτος από την εγγραφή του στην αντίστοιχη διδακτική ενότητα.
Κόστος Σεμιναρίου: 470.00 €
Αρχικό κόστος σεμιναρίου χωρίς έκπτωση.
Κόστος με έκπτωση στα 330.00 €
για Ανέργους, Πολύτεκνους-Τρίτεκνους, AMEA, Πτυχιούχους-Φοιτητές ΠαΠει, Εργαζόμενους του Πανεπιστημίου Πειραιά (μόνιμοι ή με σύμβαση), Δημοτικούς Υπαλλήλους.
Κόστος με έκπτωση στα 400.00 €
για Προπτυχιακούς Φοιτητές ΑΕΙ/ΤΕΙ ή άτομα έως 30 ετών που είναι κάτοχοι Ευρωπαϊκής Κάρτας Νέων, Συμμετέχοντες προηγούμενων κύκλων, Εγγραφή σε τουλάχιστον δύο μαθήματα ίδιας περιόδου
Ο Δρ. Νικόλαος Κουρογένης είναι καθηγητής πρώτης βαθμίδας (full professor) στο Τμήμα Χρηματοοικονομικής και Τραπεζικής Διοικητικής του Πανεπιστημίου Πειραιώς, στο οποίο διδάσκει από το 2002, τόσο στο πρόγραμμα προπτυχιακών σπουδών, όσο και στα προγράμματα μεταπτυχιακών και διδακτορικών σπουδών του Τμήματος. Από την αρχή του 2020 κατέχει τη θέση του Προέδρου του Τμήματος, ενώ από το 2018 είναι Διευθυντής των Προγραμμάτων Μεταπτυχιακών Σπουδών «Χρηματοοικονομική και Τραπεζική» και «Το Χρηματοοικονομικό και Θεσμικό Πλαίσιο των Αγορών Χρήματος και Κεφαλαίου». Είναι τακτικό μέλος της Συγκλήτου του Πανεπιστημίου Πειραιώς, ενώ έχει διατελέσει τακτικό μέλος της Επιτροπής Ερευνών του Πανεπιστημίου Πειραιώς και Διευθυντής του Προγράμματος Διδακτορικών Σπουδών του Τμήματος Χρηματοοικονομικής και Τραπεζικής Διοικητικής. Ο Δρ. Κουρογένης έχει λάβει Διδακτορικό δίπλωμα από το Εθνικό Μετσόβειο Πολυτεχνείο, και Πτυχίο από το Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών. Έχει επίσης διδάξει στο Πανεπιστήμιο Κρήτης, και διατελέσει ερευνητικός συνεργάτης του Πανεπιστημίου του Άμστερνταμ. Έχει συγγράψει περισσότερες από 30 ερευνητικές εργασίες, οι οποίες έχουν δημοσιευθεί σε διεθνή επιστημονικά περιοδικά υψηλού κύρους, όπως τα Journal of Financial and Quantitative Analysis, Econometric Reviews, Journal of Time Series Analysis, Journal of Empirical Finance, Journal of Economic Surveys, Economics Letters, American Journal of Agricultural Economics κ.α., ενώ έχει παρουσιάσει την έρευνά του σε πολυάριθμα διεθνή συνέδρια, και ως προσκεκλημένος ομιλητής. Έχει συμμετάσχει ως μέλος της ερευνητικής ομάδας σε Ευρωπαϊκά Προγράμματα, ως επιστημονικός υπεύθυνος, σε ερευνητικά προγράμματα με ιδιωτική χρηματοδότηση, και έχει εργαστεί στον ιδιωτικό τραπεζικό τομέα.
Για να προχωρήσετε στην παρακολούθηση της συγκεκριμένης διδακτικής ενότητας, παρακαλούμε εγγραφείτε σε αυτό μέσα από την ειδική φόρμα εγγραφής και παρακολούθησης μαθημάτων.
Επισκεπτόμενοι τον ιστότοπό μας, συμφωνείτε ότι χρησιμοποιούμε cookies για να σας εξασφαλίσουμε την καλύτερη εμπειρία. Τα cookies που χρησιμοποιούμε είναι τα παρακάτω: Session cookie: Απαραίτητο cookie που βοηθά στο να γίνει χρηστική η ιστοσελίδα, επιτρέποντας βασικές λειτουργίες όπως την πλοήγηση και την πρόσβαση σε ασφαλείς περιοχές της ιστοσελίδας. Η ιστοσελίδα δεν μπορεί να λειτουργήσει σωστά χωρίς αυτό το cookie. Το συγκεκριμένο cookie έχει ισχύ 365 ημέρες.
Για περισσότερες πληροφορίες κάντε κλικ εδώ.