Δευτέρα 25 Φεβρουαρίου 2019

Ανοικτά δεδομένα (open data) και εκπαίδευση

(ή μια ανάλυση των βαθμολογιών στις Πανελλήνιες)


Photo by rawpixel on Unsplash

Πρόσφατα δημιούργησα εκπαιδευτικό υλικό για την πλατφόρμα  e-learing του Πανεπιστημίου Αθηνών. Στα πλαίσια κάποιων από αυτών των μαθημάτων ζητείται από τους εκπαιδευόμενους να παρουσιάσουν μια δική τους ανάλυση σε ένα σύνολο δεδομένων της επιλογής τους. Ο συνάδερφος Δημήτρης Τσορτανίδης έστειλε μια πολύ ενδιαφέρουσα εργασία στην οποία συγκρίνει τις βαθμολογίες στα μαθηματικά στις Πανελλήνιες εξετάσεις των υποψηφίων ανά περιοχή. Η ανάλυση είναι σε αρχικό στάδιο αλλά ένα βασικό συμπέρασμα είναι η μειωμένη επίδοση σε Ξάνθη, Ροδόπη και Κεφαλονιά όπου η μέση επίδοση είναι κοντά στο 5 με άριστα το 20. Στην Ξάνθη ιδιαίτερα φαίνεται να είναι στατιστικά σημαντική.

Ο κύριος Τσορτανίδης είναι Mαθηματικός, απόφοιτος του τμήματος Μαθηματικών του Πανεπιστημίου Πατρών και κάτοχος μεταπτυχιακού διπλώματος ειδίκευσης "Μαθηματικά των Υπολογιστών - Υπολογιστές στην Εκπαίδευση" με κατεύθυνση "Υπολογιστική Νοημοσύνη" του ίδιου τμήματος. Zει και εργάζεται στην Πτολεμαΐδα ως εκπαιδευτικός. Είναι διαχειριστής των ιστοσελίδων www.emathimatika.com και www.tsortanidis.gr. Σκοπεύει να συνεχίσει τις αναλύσεις και ελπίζω να έχει σύντομα και άλλα ενδιαφέροντα αποτελέσματα. Μπορείτε να διαβάσετε όλη την εργασία του σε αυτόν τον σύνδεσμο.


 Η εργασία αυτή είναι ένα παράδειγμα της αξίας των ανοικτών δεδομένων. Με τον όρο ανοικτά δεδομένα εννοούμε δεδομένα που είναι ταυτόχρονα:
  • δημόσια και ελεύθερα επεξεργάσιμα από νομικής πλευράς
  • εύκολο να εντοπιστούν και σε κατάλληλη μορφή για επεξεργασία από υπολογιστές
Τα δεδομένα με τις βαθμολογίες βρίσκονται στη σελίδα http://www.data.gov.gr/  και ελπίζω ότι ο συνδυασμός τους και με άλλες πηγές θα δώσει πολύ ενδιαφέροντα συμπεράσματα. Σε κανονικές συνθήκες, ένα σύγχρονο κράτος θα τα αξιοποιούσε για τη χάραξη της εκπαιδευτικής του πολιτικής. Για παράδειγμα, με βάση τέτοιες αναλύσεις θα μπορούσαν να εντοπιστούν περιπτώσεις όπου χρειάζεται να τρέξουν εξειδικευμένες δράσεις για να μειώσουν το όποιο εκπαιδευτικό χάσμα μεταξύ μαθητών διαφορετικών περιοχών.


Σχετικά με μαθήματα e-learning του Πανεπιστημίου Αθηνών για την ανάλυση δεδομένων συγκεντρωμένους συνδέσμους για τα σχετικά μαθήματα μπορείτε να βρείτε στο Data Analysis Science, ένα άλλο ιστολόγιο που διατηρώ σχετικά με την ανάλυση δεδομένων.

Για όσους ενδιαφέρονται για τα ανοικτά δεδομένα στο "Κίνηση για τη διάδοση των Ανοικτών Δεδομένων"υπάρχουν κάποιες επιπλέον πληροφορίες καθώς και ένα κάλεσμα σε δράση.

Παρασκευή 9 Μαρτίου 2018

Από τα Μαθηματικά στη Data Science



Με την ευκαιρία της δημιουργίας υλικού για την πλατφόρμα e-learning του Πανεπιστημίου Αθηνών (προγράμματα «Data Analytics με την χρήση  R και KNIME»  και «Γλώσσα R: Στατιστική και Προχωρημένες Τεχνικές») σκέφτηκα να γράψω λίγα πράγματα σχετικά με την προσωπική μου διαδρομή από τα Μαθηματικά στη Data Science.
Από μαθητής είχα αυτό που λέμε κλίση στα μαθήματα των θετικών επιστημών. Έτσι τελειώνοντας το Λύκειο είχα αποφασίσει να σπουδάσω Μαθηματικά. Όταν ξεκίνησα τις σπουδές μου στο τμήμα Μαθηματικών του Πανεπιστημίου Αθηνών ένας νέος κόσμος ανοίχτηκε μπροστά μου. Θα πρέπει να πούμε εδώ ότι τα μαθηματικά που διδάσκεται κάποιος σε ακαδημαϊκό επίπεδο διαφέρουν αρκετά από αυτό της Δευτεροβάθμιας εκπαίδευσης. Η διαφορά αυτή για άλλους είναι ευχάριστη ενώ για άλλους είναι δυσάρεστη.
Εγώ ανήκω στην πρώτη κατηγορία. Έτσι μετά από μια δεκαετία, και κάτι, σπουδών απόκτησα το διδακτορικό μου με ειδίκευση στα Θεωρητικά Μαθηματικά. Μετά, άρχισα μια περιοδεία κατά την οποία δίδαξα Μαθηματικά σε ΑΕΙ και ΤΕΙ σε διάφορα μέρη της Ελλάδας. Παράλληλα, για να βγάλω τα προς το ζην, εργαζόμουν και ως καθηγητής ιδιαίτερων μαθημάτων. Η περίοδος αυτή συνέπεσε με την οικονομική κρίση της χώρας. Έτσι, τα οικονομικά μου δεν ήταν σε πολύ καλή κατάσταση. Και οι εργασιακές προοπτικές δεν έδειχναν θετικές.
Από ένα περίεργο καπρίτσιο της τύχης εκείνη την περίοδο, στην άλλη άκρη του Ατλαντικού, κάποιοι μαθηματικοί άρχισαν να χρησιμοποιούν κάποια θεωρητικά εργαλεία των Μαθηματικών για την Ανάλυση Δεδομένων. Μαθηματικές θεωρίες που είχαν (κάποια) σχέση με το διδακτορικό μου. Προς το παρόν τουλάχιστον, αυτές  οι τεχνικές δεν έχουν μεγάλη πέραση στην κοινότητα των Data Scientists αλλά αυτό είναι μια άλλη ιστορία.  Εκείνη την εποχή όμως, μου είχε κινήσει το ενδιαφέρον. Έτσι άρχισα να διαβάζω περισσότερα γύρω από το θέμα. Σταδιακά, αυτό το ενδιαφέρον επεκτάθηκε και σε άλλες τεχνικές και θέματα αυτού που σήμερα αποκαλούμε  data science.
Για όλους τους παραπάνω λόγους, αποφάσισα να ασχοληθώ επαγγελματικά με το αντικείμενο. Θα πρέπει να ομολογήσω ότι, στη δική μου περίπτωση, δεν ήταν εύκολο. Για κάποιους άλλους μαθηματικούς ήταν πιο εύκολο. Aν θέλετε να διαβάσετε μια άλλη περίπτωση υπάρχει το άρθρο «A Different Path (From Mathematics to Startups)» στο τεύχος Δεκεμβρίου 2011 vol. 58, num.11 του περιοδικού Notices of AMS. Είναι μια από τις πρώτες περιπτώσεις που έμαθα και που συνέβαλε στην απόφασή μου να ακολουθήσω μια καριέρα ως data scientist.
Αυτήν τη στιγμή εργάζομαι για μια μεγάλη εταιρεία. Μια από τις πρώτες εκπλήξεις όταν ξεκίνησα ήταν το πόσοι άλλοι μαθηματικοί είναι συνάδελφοι μου. Ακόμη και τώρα όταν προσλαμβάνεται κάποιος καινούργιος εργαζόμενος συχνά ακούω τη φράση είμαι απόφοιτος του τάδε τμήματος μαθηματικών. Θα πρότεινα σε όλους τους νυν αλλά και μελλοντικούς μαθηματικούς να έχουν στα υπ’ όψιν τους ότι μπορούν να ακολουθήσουν μια καριέρα ως  data  scientists.
Από πλευράς μου θα προσπαθήσω να ανεβάσω χρήσιμο υλικό στο  blogs «Το ιστολογιο ενος μαθηματικου» (γιατί παραμένω μαθηματικός βεβαίως) και πιο τεχνικές λεπτομέριες στο «data-analysis-science.blogspot.gr». Θα χαρώ να έχω νέα σας.

Σάββατο 10 Οκτωβρίου 2015

Μαθηματικές Ολυμπιάδες Διαγωνισμοί της Ελληνικής Μαθηματικής Εταιρείας

Μια μικρή παρουσίαση που έκανα σε συνεργασία με το δήμο Βριλησσίων για τους Πανελλήνιους Διαγωνισμούς Μαθηματικών που διοργανώνει η Ελληνική Μαθηματική Εταιρεία (ΕΜΕ) και τις διεθνείς ολυμπιάδες Μαθηματικών. Να σημειώσω εδώ κάτι που αναγράφεται και στην παρουσίαση ότι η Ελληνική Μαθηματική Εταιρεία (ΕΜΕ)  έχει ήδη ξεκινήσει μαθήματα προετοιμασίας κάθε Σάββατο. Τα μαθήματα αυτά είναι μια δράση που γίνεται κάθε χρόνο εδώ και δεκαετίες. Είναι δε δωρεάν. Στο site  της ΕΜΕ θα βρείτε όλες τις πληροφορίες σχετικά με αυτά αλλά και σημειώσεις.

Για οτιδήποτε χρειαστείτε πολύ ευχαρίστως να βοηθήσω. Αφήστε μήνυμα ή σχόλιο.



Τετάρτη 5 Αυγούστου 2015

Θεωρία Παιγνίων


Με αφορμή τον πρώην υπουργό οικονομικών κ. Γιάνη Βαρουφάκη και την εξειδίκευση του στη θεωρία παιγνίων είναι ίσως ευκαιρία να πούμε λίγα πράγματα για αυτόν τον κλάδο των Μαθηματικών. (Αρκετοί βέβαια θα ισχυριστούν ότι η θεωρία παιγνίων δεν είναι κλάδος των Μαθηματικών αλλά αυτό είναι μια άλλη ιστορία…)
          Σύμφωνα με τη Wikipedia [1] η θεωρία παιγνίων είναι η μελέτη μαθηματικών μοντέλων σύγκρουσης και συνεργασίας μεταξύ λογικών οντοτήτων. Βρίσκει εφαρμογές μεταξύ άλλων στην βιολογία, τις πολιτικές επιστήμες, την πληροφορική, τη  ψυχολογία και βεβαίως τα οικονομικά. Στη μοντέρνα εκδοχή της ξεκίνησε από ένα άρθρο του John von Neumann [2] σχετικά με τις συνθήκες ισορροπίας παιχνιδιών μηδενικού αθροίσματος μεταξύ δύο παικτών.
          Παίγνια μηδενικού αθροίσματος είναι μοντέλα καταστάσεων όπου τα κέρδη μιας πλευράς ισούνται με τη χασούρα των υπολοίπων. Μη σας μπερδεύει ο όρος ‘’παίγνιο’’. Με τη λέξη αυτή μπορεί να εννοούμε από την απλή τρίλιζα έως τα σενάρια πολέμου μεταξύ ΗΠΑ – ΕΣΣΔ που σχετίζονταν με την επιβίωση ολόκληρου του ανθρώπινου είδους!
Ένα οποιοδήποτε παίγνιο βρίσκεται σε κατάσταση ισορροπίας όταν κανένας από τους παίκτες δεν έχει συμφέρον να διαφοροποιήσει τη στρατηγική του. Δηλαδή αν υποθέσουμε ότι παίζουμε ένα τέτοιο παίγνιο τότε έχουμε κατάσταση ισορροπίας αν εμένα δεν με συμφέρει να αλλάξω στρατηγική τι στιγμή που εσείς θα διατηρήσετε την ίδια και αντίστροφα εσείς δεν έχετε συμφέρον να αλλάξετε στρατηγική αν εγώ δεν αλλάξω τη δική μου. Στο παράδειγμα των δύο (πρώην) υπερδυνάμεων ούτε οι ΗΠΑ ούτε η ΕΣΣΔ είχαν συμφέρον να μειώσει η κάθε μια μονομερώς το πυρηνικό της οπλοστάσιο. Αυτό που λέμε ισορροπία του τρόμου. Στα δικά μας, ένας από τους λόγους που η Ελλάδα δεν απέκτησε πυρηνική βόμβα είναι γιατί τότε θα αποκτούσε και η Τουρκία και θα άρχιζε έτσι μια κούρσα πυρηνικού εξοπλισμού.
Η ύπαρξη ενός τέτοιου σημείου (ή κατάστασης αν προτιμάτε) ισορροπίας έχει αποδειχτεί από τον John von Neumann για τα παίγνια μηδενικού αθροίσματος μεταξύ δύο παικτών στο άρθρο που αναφέραμε πριν. Αποδείχτηκε για οποιοδήποτε παίγνιο με πεπερασμένο πλήθος δράσεων για κάθε παίκτη από τον John Forbes Nash το 1951. Για το έργο του αυτό πήρε το βραβείο Νόμπελ Οικονομικών το 1978. Η ιστορία του έγινε διάσημη από την ταινία ‘’A Beautiful Mind’’ (‘’Ένας Υπέροχος Άνθρωπος’’)  όπου τον υποδύθηκε ο Russell Crowe.
          Έως σήμερα έντεκα ειδικοί της θεωρίας παιγνίων έχουν κερδίσει το Νόμπελ Οικονομικών. Ο τελευταίος το 2014. Είναι ένας τρόπος για να πάρουν και οι μαθηματικοί το Νόμπελ (αν και για να λέμε την αλήθεια το βραβείο αυτό δεν είναι ακριβώς Νόμπελ, μια συζήτηση που δεν είναι του παρόντος)!   

Βιβλιογραφία
2.            Neumann, J. v. (1928), "Zur Theorie der Gesellschaftsspiele", Mathematische Annalen 100 (1): 295–320, doi:10.1007/BF01448847 English translation: Tucker, A. W.; Luce, R. D., eds. (1959), "On the Theory of Games of Strategy", Contributions to the Theory of Games 4, pp. 13–42

Παρασκευή 24 Ιουλίου 2015

Βαθμολογία υποψηφίων πανελληνίων στα Μαθηματικά



Στο άρθρο αυτό έχουμε λίγα στατιστικά για την επίδοση των υποψηφίων στα Μαθηματικά (Γενικής και Κατεύθυνσης) στις Πανελλήνιες εξετάσεις κατά τα έτη 2004-2015. Έτσι μεταξύ άλλων μπορούν να απαντηθούν και κάποια ερωτήματα όπως:
·        ποιες χρονιές είχαν τα πιο δύσκολα θέματα,
·        η επίδοση των μαθητών έχει διακυμάνσεις,
·  η επίδοση στα μαθηματικά επηρεάζει τη βάση σχολών όπως το Μαθηματικό Αθηνών;

Στο παρακάτω γράφημα βλέπουμε την εξέλιξη του μέσου όρου της βαθμολογίας των υποψηφίων για τα Μαθηματικά Γενικής Παιδείας και τα Μαθηματικά Κατεύθυνσης για τα έτη 2004-2015. 
Είναι αμέσως ορατό ότι το 2013 είχαμε ένα Βατερλό των υποψηφίων μιας και τη χρονιά αυτή είχαν την χειρότερη επίδοση στα δύο αυτά μαθήματα. Ο μέσος όρος βαθμολογίας για τα Μαθηματικά Γενικής ήταν 10,83 ενώ για τα Μαθηματικά Κατεύθυνσης 8,77. Αντίστοιχα χαμηλές επιδόσεις στα Μαθηματικά Γενικής ήταν το 2005 με μέσο όρο 10,88 και το 2015 με 10,87. Η δεύτερη χαμηλότερη επίδοση στα Μαθηματικά Κατεύθυνσης ήταν το 2008 με μέσο όρο 9,66. Σε αντίθεση δηλαδή με τα Μαθηματικά Γενικής στην κατεύθυνση έχουμε σχεδόν μια μονάδα διαφορά μεταξύ των δύο χαμηλότερων επιδόσεων!

Η υψηλότερη βαθμολογία για τα Μαθηματικά Γενικής είναι 13,72 το 2009 ενώ για τα Μαθηματικά Κατεύθυνσης 12,1 το 2010.
Στο επόμενο γράφημα φαίνεται και η εξέλιξη της βάσης εισαγωγής του Μαθηματικού Αθήνας. Το σχήμα αυτό δείχνει να ενισχύει τον ισχυρισμό ότι η επίδοση των μαθητών στα δύο αυτά μαθήματα επηρεάζει και την πορεία της βάσης της σχολής αυτής. Είναι φανερό δε ότι με αυτήν τη λογική περιμένουμε πτώση στη βάση αυτής της σχολής.

Όσον αφορά τα περιγραφικά στατιστικά στοιχεία έχουμε:

Κατεύθυνση
Γενική
Μέσος
10,503
12,090
Τυπική απόκλιση
0,966
1,038
95% διάστημα εμπιστοσύνης για το μέσο
(9.890,11.117)
(11.431, 12.749)

Ο συντελεστής συσχέτισης των βαθμολογιών είναι 0,435 δηλαδή έχουμε μια μέτρια γραμμική συσχέτιση.
Περισσότερα σε επόμενη ανάρτηση...

Δευτέρα 13 Ιουλίου 2015

Πανελλήνιες 2015 - Εκτιμήσεις βάσεων εισαγωγής

e-pitixiaΠιο κάτω έχω και κάποιες εκτιμήσεις σχετικά με τις βάσεις.
 Προσοχή η διαδικασία  δεν είναι ακριβής. Η όποια χρήση των εκτιμήσεων γίνεται ΑΠΟΚΛΕΙΣΤΙΚΑ ΜΕ ΔΙΚΗ ΣΑΣ ΕΥΘΎΝΗ. Υπάρχουν αρκετοί αστάθμητοι παράγοντες στην όλη διαδικασία. Για τον παραπάνω λόγο θα μου συγχωρέσετε που φέτος το εύρος που δίνω είναι σε πολλές περιπτώσεις μεγάλο.

Σταδιακά θα ανακοινώνουμε και εκτιμήσεις για άλλες σχολές. Η μέχρι τώρα επεξεργασία δείχνει πτώση των βάσεων ως συνέπεια της χαμηλότερης επίδοσης των φετινών υποψηφίων σε κομβικά μαθήματα.
ΣχολήΠαλιά ΒάσηΔιάστημα ΕκτίμησηςΜια τιμή*
Ιατρικής Θεσσαλονίκης19122από 18793 έως 198718909
Ιατρικής Ιωαννίνων18855από 18446 έως 1853918518
Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΕΜΠ19072από 18746 έως 1899818867
Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Θεσσ.17767από 18138 έως 18319 18267
Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Πάτρας18013από 17417 έως 1759717497
Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Θράκης (Ξάνθη)17278από 16064 έως 1682116338
Μαθηματικών Αθήνας15794Οι προβλέψεις για τα τμήματα Μαθηματικών βρίσκονται στο ιστολόγιο lisari
Μαθηματικών Θεσσαλονίκης16324
Μαθηματικών Αιγαίου12471
Μαθηματικών Ιωαννίνων12993
Εφαρμοσμένων Μαθηματικών Κρήτης (Ηράκλειο)11908από 11596 έως 1251612044
Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών ΕΜΠ15951από 15362 έως 1622115789
Φυσικής Αθήνας16795από 15849 έως 1588315877
Φυσικής Θεσσαλονίκης16501από 15114 έως 1518515151
Φυσικής Ιωαννίνων14024από 13080 έως 1361513300
Χημείας Αθήνας17086από 15777 έως 1598015849
Χημείας Θεσσαλονίκης15540από 16317 έως 1648916405
Χημείας Ιωαννίνων15444από 13914 έως 1428214090
Πληροφορικής Οικ. Παν. Αθ.15820από 14736 έως 1568715428
Πληροφορικής κ Τηλεπικοινωνιων Αθήνας17221από 16424 έως 1716816727
Πληροφορικής Πειραιά15255από 14173 έως 1504414572
Επιστήμης Τροφίμων και Διατροφής του Ανθρώπου Γεωπονικού Παν. Αθήνας15448από 14611 έως 1588515209
Δείτε περισσότερες Βάσεις και στη σελίδα μας στο facebook. (Να κερδίσουμε και κανένα like χεχε)

Ευχαριστώ και τη Eureka Module για την υποστήριξη που μου παρέχει.

Δευτέρα 18 Μαΐου 2015

Θεωρία Μαθηματικών Κατεύθυνσης

Σε αυτό το άρθρο παρουσιάζω κάποιες εικόνες/στατιστικά σχετικά με το πρώτο θέμα πανελληνίων των Μαθηματικών Κατεύθυνσης για τα έτη 2004-2014. Τα στοιχεία αφορούν τις αποδείξεις, ορισμούς και διατυπώσεις θεωρημάτων. Δεν αφορούν το τι ζητήθηκε στο θέμα πολλαπλής επιλογής.

Στην πρώτη εικόνα βλέπουμε τον αριθμό εμφανίσεων κάθε κεφαλαίου. Γίνεται διαχωρισμός για το αν ζητήθηκε απόδειξη, ορισμός ή διατύπωση θεωρήματος. Βλέπουμε ότι το κεφάλαιο "Διαφορικός Λογισμός" έχει τα πρωτεία.

 
Στη δεύτερη εικόνα έχουμε μια πιο λεπτομερή ανάλυση για το ποιά κεφάλαια έχουν ζητηθεί στις Πανελλήνιες. Με αρνητικό αριθμό συμβολίζουμε κεφάλαια από το 1ο μέρος (Άλγεβρα) του βιβλίου. Δηλ. το -2,3 αντιστοιχεί στο κεφάλαιο "Μέτρο Μιγαδικού Αριθμού".
Ακολουθεί ένας πίνακας που έχει το συνολικό αριθμό εμφανίσεων κάθε κεφαλαίου ανεξάρτητα με το εάν έχει ζητηθεί ως απόδειξη, διατύπωση θεωρήματος ή ορισμός.

Τέλος, έχουμε ένα διάγραμα που απεικονίζει τη διαχρονική πορεία του 1ου υποερωτήματος, δηλ. της απόδειξης που έχει ζητηθεί.
Ως γενικό συμπέρασμα έχουμε ότι το κεφάλαιο "Διαφορικός Λογισμός" έχει ζητηθεί τις περισσότερες φορές, πράγμα φυσιολογικό μιας και είναι το μεγαλύτερο σε έκταση. Ειδικότερα, το κεφάλαιο 2.9 "Ασύμπτωτες - Κανόνας De L' Hospital", λόγω των ορισμών που περιέχει, κατέχει τα πρωτεία. Αν περιοριστούμε στις αποδείξεις υπερέχει το κεφάλαιο 2.6 "Συνέπειες του Θεωρήματος Μέσης Τιμής".