Εμφάνιση αναρτήσεων με ετικέτα open data. Εμφάνιση όλων των αναρτήσεων
Εμφάνιση αναρτήσεων με ετικέτα open data. Εμφάνιση όλων των αναρτήσεων

Το Κόμμα Σου Λαέ...

Αν διαβάζοντας τον τίτλο αυτού του κειμένου σας ήρθε στο μυαλό το Κομμουνιστικό Κόμμα Ελλάδας (Κ.Κ.Ε) ή αν πρώτα αναρρωτηθήκατε "Δηλαδή ποιό κόμμα;" για να δώσετε στη συνέχεια (συνομωτικά...ή και περιφρονητικά) την απάντηση "Ε, ένα είν' το κόμμα!"...Τότε το Marketing Department του Κ.Κ.Ε, έχει βγάλει την επιδότηση του...Συγγνώμη, τα κουπόνια του εννοώ*.


Το σημερινό κείμενο όμως δεν είναι για το Κ.Κ.Ε (ιδιαίτερα) αλλά για όσες πολιτικές παρατάξεις είναι καταγεγραμένες στη σχετική λίστα της Wikipedia αλλά και τις αλληλεπιδράσεις τους καθώς αντιμάχονται για να εκτοπίσουν τους αντιπάλους τους στην πίτα του (πεπερασμένου) εκλογικού σώματος και να το... σώσουν!

Πρόκειται δηλαδή για ένα χάρτη, ένα πίνακα στοιχείων και των ενώσεων τους, ο οποίος μπορεί να δώσει και μερικές ενδεικτικές απαντήσεις σε ερωτήσεις όπως:
  • Ποιές παρατάξεις δημιουργήθηκαν απο πολλές συνιστώσες;
  • Ποιές παρατάξεις παρείχαν τις περισσότερες συνιστώσες; (σε άλλες)
  • Ποιές είναι η πιο συχνά χρησιμοποιούμενες λέξεις στην ονοματοθεσία των πολιτικών παρατάξεων;

Για να δούμε λοίπον:

Ο χάρτης των Ελληνικών πολιτικών παρατάξεων (που είναι καταχωρημένες στη λίστα της Wikipedia) αποτελείται απο 172 πολιτικές παρατάξεις χωρισμένες σε 7 ανεξάρτητα τμήματα. Το κάθε ένα τμήμα, αποτελεί ένα σύνολο "συνδεδεμένων" παρατάξεων.

Η πιο απλή περίπτωση με την οποία μπορεί να κατανοηθεί αυτός ο διαχωρισμός είναι ο πολιτικός διαχωρισμός ανάμεσα στις παρατάξεις τις άκρας δεξιάς και τις παρατάξεις της αριστεράς. Προφανώς, δεν μπορεί να υπάρξει μια πολιτική παράταξη που να έχει μέλη και στην άκρα δεξιά και στην αριστερά και έτσι δημιουργούνται δύο ανεξάρτητα τμήματα.

Το μεγαλύτερο τμήμα (απο τα 7) αυτού του χάρτη περιλαμβάνει 101 πολιτικές παρατάξεις και έχει ώς εξής:

renderedPartyComp00

Περίπου 200 χρόνια (πολύ έντονης) πολιτικής ιστορίας...

Τον ίδιο χάρτη μπορείτε να δείτε σε φυσικό μέγεθος και πολύ πιο ευδιάκριτο απο εδώ.

Δυστυχώς το μέγεθος του είναι πολύ μεγάλο για το μέγεθος της προεπισκόπησης, κυρίως επειδή ήθελα να χρησιμοποιήσω μια σχετικά μεγάλη γραμματοσειρά για να διακρίνονται οι ετικέτες καθαρά ανεξάρτητα απο το μήκος τους.

Ο ίδιος χάρτης (αλλά και οι υπόλοιποι 6) βρίσκεται διαθέσιμος και σε SVG μορφή, που αν την "ανοίξετε" με τον browser σας έχετε και τη δυνατότητα να πατήσετε επάνω σε μια παράταξη και να μεταβείτε στη σχετική σελίδα της Wikipedia που παρείχε τα δεδομένα (Περισσότερες λεπτομέρειες πρός το τέλος του κειμένου).

Απο αυτές τις 101 πολιτικές παρατάξεις, οι παρατάξεις με τις περισσότερες συνιστώσες (εισροές απο άλλες παρατάξεις) έχουν ώς εξής:

14:   Συνασπισμός Ριζοσπαστικής Αριστεράς (ΣΥ.ΡΙ.ΖΑ)
10:   Αντικαπιταλιστική Αριστερή Συνεργασία Για Την Ανατροπή
  6:   Συμμαχία Προοδευτικών Και Αριστερών Δυνάμεων

Εκτός απο τις παραπάνω παρατάξεις,  οι υπόλοιπες έχουν απο 1-3 πολιτικές συνιστώσες.

Απο που "πηγάζουν" αυτές οι συνιστώσες; Ποιές δηλαδή παρατάξεις, έχουν συμβάλει στη δημιουργία άλλων;

9:   Πανελλήνιο Σοσιαλιστικό Κίνημα
7:   Κομουνιστικό Κόμμα Ελλάδας & Νέα Δημοκράτια (στην ίδια θέση, έχοντας παρέχει απο 7)
4:   Ένωση Δημοκρατικού Κέντρου.

Αξίζει εδώ να σημειωθεί οτι μια παράταξη "συμβάλει" στη δημιουργία μιας άλλης με δύο τρόπους: α) Ο αρχηγός της νέας παράταξης ήταν μέλος σε άλλη και αυτονομήθηκε ή β) Αναφέρεται στο σχετικό άρθρο πως στη νέα παράταξη συμμετείχαν μέλη απο μια άλλη παράταξη.

Τι ζητάνε όλες αυτές οι παρατάξεις; Ποιά είναι η αποστολή τους; Ποιό είναι το όραμα που θέλουν να βάλουν επάνω στο προϊόν που φέρνουν σε αυτή την αγορά; Ποιές λέξεις χρησιμοποιούνται πιο συχνά στην ονοματοθεσία όλων αυτών των παρατάξεων;

Το παρακάτω πληθυσμετικετοσύγνεφο (!) δημιουργήθηκε στο Wordle εισάγοντας τη λίστα με τα ονόματα των παρατάξεων:

AllPartiesNames

Ο πολιτικός χώρος της Ελλάδας έχοντας πέσει σε δημοκρατικό κόμα



Οργάνωση, Ένωση, Συμμαχία, Κίνημα, Κόμμα....και τηγανήτες τίποτα. Ακόμα, "έθνος ανάδελφον" (είμεθα).



Όσοι φτάσατε ώς εδώ, μπορείτε να συνεχίσετε να διαβάζετε για μερικές μικρές τεχνικές λεπτομέρειες αλλά και παραπομπές πρός τα δεδομένα και περισσότερες εικόνες που περιγράφουν τον πλήρη χάρτη.


Τα Δεδομένα...

Τα δεδομένα τα μάζεψα το 2010, σε μια πρώτη προσπάθεια να δημιουργήσω ένα τέτοιο χάρτη. Η συλλογή έγινε χειροκίνητα μια και το είδος των δεδομένων που αναζητούσα δεν ήταν κωδικοποιημένο αλλά ούτε και με σαφή δομή για να γίνει αυτόματα. Για να καταλάβει κανείς τι οδήγησε στη γέννηση μιας παράταξης, ποιός είναι ο αρχηγός (ή κύριες προσωπικότητες) της και απο ποιό χώρο προέρχεται πρέπει να διαβάσει το κείμενο και να το κατανοήσει, πάρα να ψάχνει για απομονωμένες λέξεις ή φράσεις. Τα δεδομένα αυτά τα ενημέρωσα πρόσφατα με όσες παρατάξεις είχαν δημιουργηθεί μέσα στα τελευταία δύο χρόνια και είχαν προστεθεί στη λίστα της Wikipedia και τα παρουσιάζω εδώ σε επιμέρους διαγράμματα που δείχνουν τις αλληλεπιδράσεις τους.

Αξίζει να σημειωθεί οτι σε αυτά τα δεδομένα, υπάρχουν κάποιες οντότητες οι οποίες δεν είναι ακριβώς πολιτικές παρατάξεις αλλά δεν μπορούσα να μην τις συμπεριλάβω. Για παράδειγμα, η οντότητα "Ελληνική Δικτατορία" δεν είναι πολιτική παράταξη αλλά αντιπροσωπεύει το (καταγεγραμμένο) γεγονός της συμμετοχής ανθρώπων που είχαν ρόλο στην Ελληνική δικτατορία σε παρατάξεις που δημιουργήθηκαν μετά τη μετα-πολίτευση.

Το ίδιο ισχύει και για τις στρατιωτικές οργανώσεις που έδρασαν κατα τον εμφύλιο (κυρίως) αλλά είχαν και πολιτική δράση όπως και οι σχετικές "νεολαίες". Τέλος, μη παραταξιακή οντότητα αποτελούν και οι "Ανένταχτοι Πολίτες".

Προσοχή: Θα ήθελα να σημειώσω οτι αν κάποιος βρεί κάποιο τραγικό ιστορικό λάθος (!) διαβάζοντας αυτά τα διαγράμματα, καλό θα ήταν εκτός απο το να αφήσει ένα ενδεικτικό σχόλιο, να ανατρέξει στη σχετική σελίδα της Wikipedia που ίσως να περιέχει το αρχικό λάθος.

Η Επεξεργασία...

...ήταν όσο απλό είναι και το να "συνδέσεις τις τελείες". Το δύσκολο σε αυτή τη περίπτωση ήταν η εξαγωγή των δεδομένων.

Τα Διαγράμματα...

Τα διαγράμματα δημιουργήθηκαν με το graphviz και είναι επίτηδες στείρα, ξερά, ασπρόμαυρα και όσο το δυνατόν πιο αντικειμενικά.

Παρ' όλα αυτά, υπάρχουν διαθέσιμα στις εξής τρείς γεύσεις:

PNG εικόνες,

SVG διαγράμματα με ενσωματομένες διευθήνσεις πρός τις σελίδες που παρείχαν τα δεδομένα; και

DOT αρχεία που περιγράφουν τα διαγράμματα.


Σημειώσεις:
*: Παρεμπιπτόντως, έχει πεί κανείς στο Marketing Department (Υπόγειο ΖΓ) οτι τελείωσε ο πόλεμος ή τους παρακολουθούν ακόμα με το περισκόπιο;

Στον Πηγεμό Για Το...Vancouver

Μές τη ζωή, δρόμοι ανοίγονται σωρό
κι όποιον γουστάρεις τον τραβάς κι όπου σε βγάλει
Μα είναι κι ένα μονοπάτι πονηρό
που πάει ντουγρού, στη κατηφόρα τη μεγάλη
Το Μονοπάτι



 Ποιό είναι το μονοπάτι της μικρότερης απόστασης / ελάχιστης προσπάθειας, ώστε ο τρόπος ζωής στο Karachi του Πακιστάν να μετασχηματιστεί σε αυτόν του Βανκούβερ του Καναδά; Ποιός είναι ο δρόμος με τις λιγότερες μεταρρυθμίσεις;

Το σημερινό κείμενο αναφέρεται στις επιλογές και τις συνέπειες τους αλλά βγήκε λίγο μεγάλο :-/ Γι' αυτό είναι χωρισμένο σε 4 ενότητες: Στο Mουσείο, Οι αριθμοί, Οι εικόνες και...Choose life, choose a job, choose a carreer....

Μπορείτε να τις διαβάσετε ξεχωριστά ή όλες μαζί. Οι πιο ανυπόμονοι μπορείτε πάντα να αναφερθείτε στην πολύ πιο σύντομη έκδοση που υπάρχει στο BuzzData.

Πρίν συνεχίσω με τις απαντήσεις στις παραπάνω ερωτήσεις θα ήθελα να γράψω δύο λόγια για το ποιά ήταν η αφορμή που καταπιάστηκα με αυτό το θέμα στα τελευταία τρία κείμενα.

Στο Μουσείο...
Το 2008, πήγα μια βόλτα στο Βρετανικό Μουσείο. Η (μόλις) 29η φωτογραφία που έβγαλα εκεί, δεν ήταν η Ροζέτα ή τα μάρμαρα του Παρθενώνα, αλλά αυτό εδώ το πόστερ:

Το ένα απο τα δύο πόστερ του Βρετανικού μουσείου που αναφέρονταν στον πόλεμο του Ιράκ, τις επιπτώσεις του στη παράδοση της χώρας. Οι 3/5 λεζάντες των φωτογραφιών απο αριστερά πρός τα δεξιά: "Το στρατόπαιδο στον αρχαιολογικό χώρο της Βαβυλώνας", " 'Πλιατσικαδόροι' (looters) στον αρχαιολογικό χώρο της 'Isan' (;)", "Η εκκλησία Al-Askari στη πόλη Samarra, πρίν και μετά τον...βομβαρδισμό". 
Οι δύο τελευταίες εικόνες στα δεξιά αναφέρονται στη βοήθεια που παρείχε το Βρετανικό Μουσείο σε Ιρακινούς αρχαιολόγους (υπο τη μορφή εκπαίδευσης) και δείγμα ενός αρχαίου ευρύματος.
Η φωτογραφία προέρχεται απο τη προσωπική μου συλλογή.


Το 2008 ο πόλεμος στο Ιράκ μέτραγε ήδη 5 χρόνια και τα μέσα είχαν φροντίσει να μας πληροφορήσουν αναλόγως για την, πάντα φρέσκια και αγέραστη αγριότητα του με βιντεσκοπημένους αποκεφαλισμούς, βιντεοσκοπημένες επιχειρήσεις αυτοκτονίας και διάφορα αναμνηστικά βίντεο απο "εκείνη τη φορά που αμολήσαμε ένα χέλφάϊ(α)ρ και έφερε κάτω το μισό σύμπαν...κατα λάθος".

Αργότερα, έκαναν την εμφάνιση τους και άλλα βίντεο, δείχνοντας ζημιές στα εκθέματα του μουσείου της Βαγδάτης[1] και αποκαϊδια στην Εθνική Βιβλιοθήκη (στην Βαγδάτη) που είχε την κακή τύχη να έχει χτιστεί απέναντι ακριβώς απο το υπουργείο άμυνας (...εδώ δεν θα τη πειράξει κανένας!).

Καθόμουν λοιπόν εκεί και χάζευα το πόστερ αυτό και το διπλανό (που δεν μπορούσα να το φωτογραφήσω) με σουρεαλιστικές σκηνές απο αδιάφορα άρβυλα να ανεβοκατεβαίνουν στα Ιρακινά "μάρμαρα" και κοντέηνερ εγκατεστημένα μέσα σε αρχαιολογικούς χώρους στη Βαβυλώνα και αναρρωτιόμουν, πώς ήταν δυνατόν, η πόλη που ήταν μια φορά κι ένα καιρό το κέντρο του κόσμου και της διανόησης να έχει φτάσει σήμερα σε αυτή την ανυπόφορη κατάσταση.

Και πώς, αν θα ήταν ποτέ δυνατόν να το βάλει νούς ανθρώπου, πώς θα μπορούσε μια λαμπερή υπερσύγχρονη πόλη του σημερινού, του τρέχοντος, του ακλονήτου, του δικού μας υπερσύγχρονου και υπερσυνδεδεμένου τωρινού τρισευτυχισμένου κόσμου να βρεθεί σε μια παρόμοια κατάσταση στο μέλλον, όταν αδιάφορα άρβυλα θα κατουρούν και θα βλαστημάνε τη τύχη τους εκεί που σήμερα άνθρωποι προσεύχονται και θυμούνται τους νεκρούς τους και κλέφτες θα εμπορεύονται πανάκριβα μνημεία που σήμερα εγκαινιάζονται;

Τράβηξα δύο άξονες κι έβαλα πάνω δεξιά τη Νέα Υόρκη και κάτω αριστερά τη Βαγδάτη. Στο περιθώριο, άφησα τη σημειώση "Αθήνα;; -->"... Quo Vadis ρε Αθήνα;

Οι Αριθμοί...
Αυτές οι σκέψεις ήταν το κίνητρο που με έκανε να ασχοληθώ με τα δεδομένα που παραχωρήθηκαν απο την EIU στο BuzzData με αφορμή τον διαγωνισμό  Best City Contest 2012 αμέσως μόλις έγιναν διαθέσιμα. Απο τα πρώτα διαγράμματα που έδειχναν την απόσταση της Αθήνας απο άλλες πόλεις, μέχρι τον χάρτη και την έννοια της απόστασης που είδαμε στο προηγούμενο κείμενο και στη κατάληξη σήμερα με τα μονοπάτια και τις διαδρομές μέσα σε αυτό το χάρτη.

Έχοντας εξηγήσει την έννοια της απόστασης ώς εδώ και το πως μπορούμε να τη χρησιμοποιήσουμε για να "δούμε" πολυδιάστατες ποσότητες, είναι καιρός να κάνουμε το επόμενο...βήμα.

Μπορούμε πολύ απλά να ξεκινήσουμε απο μια πόλη και να μεταβούμε σε μια άλλη μέσω μιας σειράς όσο το δυνατόν μικρότερων αλμάτων πρός τους πιο κοντινούς προορισμούς. Για λόγους που εξηγούνται στο [2] δεν θα εξετάσουμε όλους τους προορισμούς αλλά μόνο τους 5 πιο κοντινούς για κάθε πόλη.

Τα μονοπάτια που θα προκύψουν δείχνουν τον δρόμο της μικρότερης προσπάθειας που πρέπει να καταβάλουν οι πόλεις για να μετακινηθούν στους δείκτες τις EIU πρός πιο ευνοϊκές θέσεις.

Ας δούμε μερικά μονοπάτια τα οποία προκύπτουν ξεκινόντας απο μια πολή και προσπαθόντας να φτάσουμε σε μια άλλη διανύοντας τη μικρότερη απόσταση.

Το μονοπάτι για τη διαδρομή Karachi -Vancouver έχει ώς εξής:

Karachi, 
Abidjan, Colombo, Ho Chi Minh City, Hanoi, Casablanca, Cairo, Istanbul, Bogota, Quito, Asuncion, Warsaw, Santiago, Buenos Aires, Los Angeles, Chicago, Atlanta, Washington DC, Paris, 
Vancouver

Συνολική απόσταση κατα μήκος του παραπάνω μονοπατιού: 71.5792 μονάδες απόστασης

Ενώ η διαδρομή Αθήνα - Vancouver έχει ώς εξής:

Athens, 
Taipei, Lexington, Cleveland, Detroit, Atlanta, Washington DC, Paris, 
Vancouver

Συνολική απόσταση κατα μήκος του μονοπατιού: 21.9838 μονάδες απόστασης

Παρατηρήστε εδώ οτι το Atlanta, Washington DC, Paris, Vancouver, μένει το ίδιο και στις δύο διαδρομές. Το θέμα δηλαδή είναι να προσεγγίσει μια πόλη όσο το δυνατόν πιο γρήγορα την "ευθεία οδό".

 Οι αριθμοί αυτοί απο μόνοι τους δίνουν μια εικόνα για το μέγεθος της προσπάθειας που θα χρειαζόταν για να μετασχηματιστεί μια πόλη σε μια άλλη αλλά ο τρόπος που υπολογίζεται μπορεί να τοποθετήσει δύο πόλεις στην ίδια απόσταση ενώ η κατάσταση στην οποία βρίσκονται να είναι πολύ διαφορετική. Με άλλα λόγια, σε απόσταση 10 μπορεί να βρεθεί μια πόλη που διαφέρει σε 2 δείκτες αλλά και μια πόλη που διαφέρει σε 20...Ανταποκρίνονται αυτά τα στοιχεία σε συγκρίσιμους τρόπους ζωής; ...Πώς μπορεί αυτή η παρατήρηση να συμπεριληφθεί στη κατάταξη;

Αυτό μπορεί να γίνει αλλάζοντας την έννοια της απόστασης και χρησιμοποιόντας μια "μεζούρα" η οποία κατατάσει τις πόλεις με βάση το πόσους δείκτες έχουν διαφορετικούς μεταξύ τους και άρα με το πόσες μεταρρυθμίσεις "απέχουν" απο τις γειτονικές τους πόλεις.

Αυτή η έννοια της απόστασης λέγεται "Hamming" απο τον κύριο που σκέφτηκε τη δυαδική της έκδοση[3]. Μια δοκιμή θα σας πείσει: Ας υποθέσουμε οτι μια πόλη έχει δείκτες 1,1,1 και μια άλλη 2,2,2. Η απόσταση τους κατα τον Ευκλείδη είναι φυσικά 1.7320, η απόσταση τους όμως κατα Hamming είναι 3.0000 γιατί τα δύο σύνολα των αριθμών διαφέρουν και στα τρία στοιχεία τους.


Για τις παραπάνω περιπτώσεις:

Karachi - Vancouver: 30 Διαφορετικοί δείκτες
Athens - Vancouver  : 26 Διαφορετικοί δείκτες

Άρα λοιπόν, παρ' όλο που η απ' ευθείας απόσταση ανάμεσα στο Karachi και το Vancouver είναι 16.5831, η άμεση κάλυψη της θα απαιτούσε την αλλαγή 30 δεικτών μονομιάς και άρα ένα πολύ μεγάλο απόθεμα πόρων [4,5]

Παρ' όλα αυτά, η μεγαλύτερη διαδρομή με συνολικό μήκος 71.5792 εμπλέκει 19 μεταβάσεις και άρα περίπου 30 / 19 = 1.57 μεταρρυθμίσεις ανα βήμα...Ένας πιο λογικός ίσως στόχος για τον εκάστοτε δήμαρχο.

Παρομοίως, η Αθήνα απαιτεί ένα συγκρίσιμο αριθμό μεταρρυθμίσεων (26) για να προσεγγίσει το Vancouver μέσω της οδού της ελάχιστης προσπάθειας και απέχοντας μικρότερη (ευθεία) απόσταση απο το Karachi (5.9160) απαιτεί 26/9 ~ 2.8888 μεταρρυθμίσεις ανα βήμα.

Οι Εικόνες...
Συνδιάζοντας τις εκφράσεις των δύο αποστάσεων μπορούμε να κινηθούμε ανάμεσα στις πόλεις, πηγαίνοντας ΚΑΙ πρός την πιο κοντινή πόλη ΚΑΙ πρός την πόλη με τις λιγότερες μεταρρυθμίσεις. Έτσι, η κατάταξη τους μπορεί να γίνει μέ βάση την απόσταση τους απο το Vancouver ή την κάθετη θέση μιας πόλης στο διάγραμμα που δείχνει απλά πόσο μακριά είναι μια οποιαδήποτε πόλη απο την πόλη με την καλύτερη βαθμολογία.

Αστική Αποστασιοποίηση. 
Το γράφημα δημιουργήθηκε με το graphviz και αποτέλεσε μέρος της συμμετοχής στο διαγωνισμό BestCityContest του Buzzdata και της EIU.

Αυτή η έννοια της κατάταξης σε επίπεδα ή ζώνες αποστάσεων, μαζί με την ιδέα οτι οι δήμαρχοι των πόλεων προσπαθούν (ή τουλάχιστον θέλω να πιστεύω οτι προσπαθούν) με τις επιλογές και τη διαχείρηση που κάνουν να "σπρώξουν" τις πόλεις τους πρός ένα καλύτερο τρόπο διαβίωσης ενέπνευσαν και τη προσπάθεια να απεικονιστούν αυτά τα δεδομένα στις 3 διαστάσεις.

Οι παρακάτω εικόνες ΔΕΝ έχουν σχέση με τον μύθο του Σύσιφου (μήπως θα έπρεπε; ). Στο ρόλο του "φιλόδοξου δημάρχου" που σ(μ)πρώχνει την πόλη του πρός το πρότυπο του Vancouver είναι η αφεντιά μου....Λίγο thresholdαρισμένη και δισδιάστατη βέβαια...αλλά ίσως καλύτερα έτσι!

Το πρόβλημα με αυτές τις απεικονίσεις και ο λόγος που παρ' όλο που τις έφτιαξα δεν τις υπέβαλα στο διαγωνισμό ήταν οτι είχαν πολλά διακοσμητικά στοιχεία που δεν προσέθεταν κάτι στην εικόνα.

Μερικές μικρές τεχνικές λεπτομέρειες: Η απεικόνηση δημιουργήθηκε στο Blender. Τα γράμματα απάνω σε κάθε marker είναι billboards και ακολουθούν την κάμερα για να είναι (όσο το δυνατόν περισσότερο) ευανάγνωστα. Ο προσανατολισμός της φιγούρας του κάθε marker γίνεται αυτόματα πρός την πόλη που υποτίθεται οτι προσπαθεί να μεταβεί και αν ένα αντικείμενο μετακινηθεί απο τη θέση του, όλα τα υπόλοιπα θα αλλάξουν προσανατολισμό ανάλογα Όλες οι παρακάτω εικόνες προέρχονται απο τη προσωπική μου συλλογή.

A close up on Helsinki to show the little figurines


3d aspect of the shortest branches overall


3D aspect of the Paris Branch


Η ιδεατή περίπτωση θα ήταν το μέγεθος της σφαίρας και το μέγεθος της φιγούρας να ανταποκρίνονται σε κάποια ποσότητα έτσι ώστε ο θεατής με μια ματιά να απορροφά όσο το δυνατόν περισσότερες πληροφορίες.

Για παράδειγμα θα μπορούσε το μέγεθος της  φιγούρας, που οδηγεί τη σφαίρα (που οδηγεί την εξέλιξη μιας πόλης), να αντικατοπτρίζει τους οικονομικούς (ή άλλους) πόρους που έχει στη διάθεση της μια πόλη και αναλόγως, το μέγεθος της σφαίρας να αντικατοπτρίζει τις υποχρεώσεις που έχει αυτή η πόλη ή η χώρα στην οποία ανήκει η πόλη (για παράδειγμα το χρέος της ή τα έξοδα συντήρησης)...

Έτσι ώστε να καταλαβαίνει κανείς, οτι ναι μέν δυο οποιεσδήποτε πόλεις βρίσκονται στο ίδιο σκαλοπάτι, αλλά η προσπάθεια για να ανέβουν στο επόμενο δεν είναι ίδια για όλες συναρτήσει άλλων παραγόντων (πολιτικών, οικονομικών, κοινωνικών ή άλλων).


Choose life. Choose a job. Choose a career...

Αν υποθέσουμε οτι όλες οι μεταρρυθμίσεις απαιτούν την ίδια προσπάθεια, τότε θα μπορούσαμε να πούμε οτι αν ο κάθε δήμαρχος εστιαζόταν κάθε χρόνο να βελτοιώσει ΕΝΑ δείκτη σε 20-30 χρόνια και το Καράτσι αλλά και η Αθήνα θα μπορούσαν να έχουν ένα πολύ διαφορετικό τρόπο ζωής απο αυτόν που έχουν σήμερα...

Υποτίθεται βέβαια οτι, οι υπόλοιπες πόλεις θα παραμείνουν σταθερές όσο μια πόλη βελτοιώνεται, κάτι που δεν μπορεί να ισχύει για μεγάλο χρονικό διάστημα. Αν όλες οι πόλεις "σκεφτούν" με τον ίδιο τρόπο, τον επόμενο χρόνο το πεδίο των αποστάσεων θα έχει αλλάξει και μακροπρόθεσμα θα πρέπει και η EIU να αλλάξει και τον τρόπο που βαθμολογεί τις πόλεις γιατί όλες θα αρχίσουν να έχουν την ίδια (πολύ καλή) βαθμολογία ή θα αρχίσουν να συγκετρώνονται τόσο πολύ γύρω απο συγκεκριμένα σημεία του πεδίου που η "μεζούρα" θα χρειαζόταν ανα-βαθμονόμηση για να γίνει πιο ακριβής.

Δυστυχώς όμως, οι δείκτες της EIU, δεν απαιτούν την ίδια προσπάθεια...Και σε αυτό το σημείο ο συλογισμός περνάει σε δύο άλλες ωραίες ερωτήσεις οι οποίες έχουν να κάνουν με το ποιά είναι η "ενέργεια" μιας πόλης για αλλαγή;;;

Και, λαμβάνοντας υπ όψην την "ενέργεια" της πόλης πώς θα μπορούσε να οριστεί το σημείο της μη αναστρέψιμης καταβολής;;; Το σημείο δηλαδή πέρα απο το οποίο, η "ενέργεια" που έχει μια πόλη δεν μπορεί να την κρατήσει ούτε κάν στην ίδια βαθμολογία και απο εκεί και πέρα αρχίζει μια φθορά, μια καταβολή, μια......κατηφόρα.

Αυτές οι ερωτήσεις περιλαμβάνουν μέσα και οικονομικούς δείκτες με τους οποίους δεν είμαι και πολύ εξοικειωμένος. 'Ολο και κάτι θα βρίσκεται στα δεδομένα της τράπεζας του κόσμου αλλά αν θέλετε, διαφωτείστε ελεύθερα στα σχόλια (!).


Τέλος και για όσους αναρρωτήθηκαν στο μεταξύ..."Καλά όλα αυτά ρε ΑΑ, αλλά δεν μας είπες, η Χαλκίδα που είναι σε όλα αυτά τα γραφήματα;;;"...

Η Χαλκίδα.......(κακοήθεις χαρακτήρες).......είναι off the scales!!!


Σημειώσεις:
[1] : Για αρκετό καιρό, παρακολουθόντας kυρίως το BBC είχα την εντύπωση πως το μουσείο της Βαγδάτης είχε λεηλατηθεί συστηματικά. Άλλη μια...Παράπλευρη Απώλεια. Παρ' όλα αυτά, το άρθρο της wikipedia, αναφέρει οτι το μουσείο είχε ήδη έτοιμο σχέδιο έκτακτης ανάγκης απο...τον προηγούμενο πόλεμο, οπότε τα σημαντικότερα αρχαία ευρήματα ήταν ήδη ασφαλισμένα όταν έφτασαν τα...χειρότερα.


[2] : Εδώ βέβαια θα πρέπει να πούμε οτι ανάλογα με το πόσο γρήγορα αυξάνεται η απόσταση μιας πόλης με τις άλλες (αθροιστική απόσταση), ίσως υπάρχει ένα φυσιολογικό κατώφλι πέρα απο το οποίο η απόστασεις αυξάνονται πάρα πολύ γρήγορα και δεν υπάρχει λόγος να θεωρηθούν κοντινές...Τέτοιο σαφές κατώφλι δεν υπήρχε στα συγκεκριμένα δεδομένα....Έτσι αντί να συμπεριλάβουμε όλες τις πόλεις, συμπεριλαμβάνουμε μόνο τις 5 πιο κοντινές (Το 5 εδώ είναι μια αυθαίρετη επιλογή).


[3] : Και στα Ελληνικά βέβαια...Χαμίνγκια Απόσταση (χωρίς αμφιβολία....και φυσικά απο εκεί βγαίνει και η Πλατεία Χάμινγκος).


[4] : Η ευθεία γραμμή είναι ο συντομότερος δρόμος, αλλά ο συντομότερος δρόμος είναι  και ο πιο "ακριβός" (!)


[5] : Μέγιστη απ' ευθείας απόσταση δεικτών που μπορούν να έχουν δύο πόλεις: 25.2982

Δια-Διαστασιακή Περιήγηση...

 "... μπορούμε, με μια πολύ όμορφη τεχνική, να φέρουμε όλες αυτές τις πόλεις και τις πληροφορίες για τις μεταξύ τους αποστάσεις σε μια και μόνο, δισδιάστατη εικόνα. Αυτό όμως θα το δούμε στο επόμενο κείμενο, πολύ σύντομα!"

Κάθε φορά που προσπαθείς να βάλεις τα πράγματα σε μια σειρά, ο θεός (και συγγραφέας του "Απο την τάξη στο χάος κι εμπλοκή: Πώς να δημιουργήσετε το δικό σας σύμπαν σε 3.1415928 απλά βήματα" εκδόσεις Έρεβος), απελευθερώνει μια πιρουνοβόμβα στο δικό σου μικρό προσωπικό σύμπαν και σε κάνει να νιώθεις σα να προσπαθείς να τρέξεις τα 100 μέτρα σε 8 δευτερόλεπτα βυθισμένος σε μια πισίνα γεμάτη μέλι.

Αυτός ίσως να είναι ένας πιο περίπλοκος τρόπος για να περιγράψω τι έχει συμβεί μέσα σε αυτές τις 40 ημέρες απο το προηγούμενο κείμενο και το πώς είναι δυνατόν αυτό το διάστημα να χαρακτηριστεί "πολύ σύντομα!", αλλά πιστέψτε με, βλέποντας τα πράγματα απο τη δική μου σκοπιά, η παραπάνω εξήγηση φαντάζει απίστευτα λογική! Όπως είχε πεί και ο Προμηθέας της υπέρτατης γνώσης (γνωστός και ως Murphy) "Αν ξέρεις οτι κάτι μπορεί να πάει "στραβά" (ή τέλος πάντων, λιγότερο ευνοϊκά) και δεν προετοιμαστείς για αυτό....Τότε αυτό θα πάει στράβα (έστω και αν η πιθανότητα για αυτό το ενδεχόμενο φαινόταν πάρα πολύ μικρή)"....Αυτός...ξέρει!

Οπότε, ας δούμε λίγο πιο αναλυτικά αυτές τις δύο, φαινομενικά αθώες γραμμές της εισαγωγής, πρίν κάποιο ενδεχόμενο με πιθανότητα τόσο μικρή που δεν χωράει σε ανθρώπινο κεφάλι, αποφασίσει να καθυστερήσει αυτή τη σειρά πόστ για άλλη μια φορά (!).


Σύμφωνα λοιπόν με τα δεδομένα της Economist Intelligence Unit, οι δύο πόλεις στις οποίες ο τρόπος διαβίωσης απέχει τη "μεγαλύτερη απόσταση", είναι το Karachi - Pakistan και το Vancouver - Canada.

Εδώ βέβαια, δεν αναφερόμαστε στη γεωγραφική απόσταση, αλλά στην απόσταση όπως αυτή ορίζεται απο το διάνυσμα των 40 δεικτών που χαρακτηρίζουν κάθε πόλη. Αυτή η έννοια της απόστασης, έχει μια ιδιαίτερη σημασία και περιεχόμενο.

Για να δούμε λοιπόν: Τι πληροφορίες μπορεί να μας δώσει η έννοια της απόστασης; Ποιό είναι το μονοπάτι της "ελάχιστης προσπάθειας", ώστε το Karachi να "μετατραπεί" σε Vancouver; Ποιό είναι το μονοπάτι των λιγότερων μεταρυθμίσεων για τον ίδιο σκοπό; Ποιά είναι τα παραπάνω μονοπάτια όσο αφορά την Αθήνα;

Το κλειδί των απαντήσεων στις παραπάνω ερωτήσεις, βρίσκεται κατα ένα μεγάλο μέρος, στην έννοια της "απόστασης".  Ήδη στο προηγούμενο κείμενο, είδαμε την έννοια της γνώριμης Ευκλείδιας απόστασης ανάμεσα στα σημεία ενός χώρου. Η μόνη διαφορά στη περίπτωση των δεδομένων της EIU και την "απόσταση" ανάμεσα σε δύο σημεία (για παράδειγμα, ανάμεσα στην Αθήνα και τη Θεσσαλονίκη) είναι οτι αυτός ο χώρος δεν έχει 3 αλλά 40 διαστάσεις.

Ένα χώρο 40 διαστάσεων, είναι ίσως δύσκολο να τον φανταστεί κανείς. Με τι μοιάζει ένα σπίτι στις 40 διαστάσεις; Με τι μοιάζει ένα αυτοκίνητο; Ένα ποτήρι, ή ένας απλός κύβος (ένα παραδοσιακά τρισδιάστατο σχήμα); Τι είναι διάσταση;

Διάσταση είναι μια ιδιότητα ενός αντικειμένου που αν τη στερηθεί, τότε δεν μπορεί να οριστεί πλήρως. Είναι αδύνατον να οριστεί ένας κύβος (ένα στερεό 3 διαστάσεων: Μήκος, Ύψος, Βάθος) στις 2 διαστάσεις γιατί θα ήταν αδύνατον να εκφραστεί το βάθος του.

Η απεικόνιση ενός πολυδιάστατου χώρου είναι απο τις λίγες περιπτώσεις όπου χρειάζεται να "δούμε" ακριβώς τη μορφή αυτού του χώρου. Συνήθως, τον δουλεύουμε "στα τυφλά" με βάση κάποιους απλούς κανόνες. Για παράδειγμα, με βάση τον απλό κανόνα: "Δύο διανύσματα είναι κάθετα όταν το εσωτερικό γινόμενο τους είναι 0", μπορούμε να κατασκευάσουμε κάθετα διανύσματα στις οποιεσδήποτε Ν διαστάσεις ΧΩΡΙΣ να χρειάζεται να τις "δούμε".....Δεν είναι ανάγκη να το "δείς" για να πιστείς (!) (Για περισσότερες λεπτομέρειες και μια ωραία εισαγωγή στο θέμα τουλάχιστον για τις 4 διαστάσεις μπορείτε να δείτε εδώ)

Δυστυχώς, δεν θα κατανοήσουμε ποτέ την μαγεία ενός "τετραπλού τόλουπ" στις 6 διαστάσεις (ο Κωστάλας παραμένει αδιάβλητος σε μετασχηματισμούς (!)), ή τι αδιανόητα αεροβατικά μπορεί να σκεφτεί ο πιλότος των 9 διαστάσεων.  Δεν είμαστε φτιαγμένοι για αυτούς τους χώρους. Οι αισθήσεις μας είναι περιορισμένες στις 3 (το πολύ) διαστάσεις.

Στη προσπάθεια μας λοιπόν να κατανοήσουμε ένα 40διάστατο αντικείμενο στα περιθώρια ενός δισδιάστατου χώρου (ενός φύλου χαρτιού δηλαδή) και γνωρίζοντας πως δεν μπορούμε να του στερήσουμε καμία διάσταση τι κάνουμε;

Μπορεί να μην μπορούμε να στερήσουμε μια διάσταση απο τον κύβο, αλλά μπορούμε να βρούμε ένα τρόπο ώστε η τρίτη διάσταση να εκφραστεί μέσα απο τις δύο...Μπορούμε δηλαδή να προβάλουμε τις 3 διαστάσεις σε 2 ή γενικότερα, τις πολλές διαστάσεις σε λίγες...με την προυπόθεση βέβαια οτι αποδεχόμαστε κάποιο σφάλμα....Τι είναι αυτό το σφάλμα; Για να δούμε...

Στη παρακάτω εικόνα, ποιό σχήμα είναι ένα πραγματικό εξάγωνο και ποιό σχήμα είναι ένας κύβος καθώς τον κοιτάμε απο μια γωνία του;



Μαϊμού κύβοι! Κυκλοφορούν ανάμεσα μας!!!...
Οι τρείς γραμμές στο δεξιό σχήμα έχουν προστεθεί για να τονιστεί η ομοιότητα του εξαγώνου με τον κύβο απο αυτή τη γωνία...Ουσιαστικά πρόκειται για το ίδιο ακριβώς σχήμα.


Ακριβώς αυτό....Προσπαθόντας να προβάλουμε ένα κύβο απο τις τρείς στις δύο διαστάσεις, παραμορφώθηκε τόσο πολύ, που κατάντησε ένα τιποτένιο δισδιάστατο 6γωνο.....Απ' τα ανώγια, στα κατώγια...

Η προβολή των 3 διαστάσεων στις 2 είναι υπόθεση εύκολη...κυρίως επειδή τα μάτια και ο εγκέφαλος μας, είναι φτιαγμένα για να καταλαβαίνουμε δισδιάστατα αντικείμενα και να "φανταζόμαστε" τα τρισδιάστατα. Πώς όμως θα προβάλουμε 40 διαστάσεις; Δεν είναι μια δεν είναι δύο, δεν είναι τρείς....Είναι 40!

Είτε στη μια, είτε στις δύο, είτε στις τρείς, είτε στις δεκατρείς διαστάσεις, η έννοια της απόστασης* παραμένει η ίδια. Δέκα μέτρα απόσταση στις 20 διαστάσεις είναι ακριβώς δέκα μέτρα και στις 2 διαστάσεις. Και η απόσταση, είναι απλά ένας θετικός (πάντα) αριθμός.

Για να δούμε λοιπόν, μπορούμε να φανταστούμε ένα τρόπο, ώστε να προβάλουμε τα σημεία ενός 40διάστατου αντικειμένου στις 2 διαστάσεις με όσο το δυνατόν μικρότερη παραμόρφωση;

Η απάντηση σε αυτή την ερώτηση είναι σχετική με το αντικείμενο του διαγωνισμού Best City Contest. Ο διαγωνισμός μάλιστα, μας καλεί να προβάλουμε τις 40 διαστάσεις (ή υποσύνολο αυτών, ή ακόμα και νέο σύνολο με την προσθήκη άλλων δεικτών) σε 1. Να κατατάξουμε δηλαδή τις πόλεις επάνω σε μια γραμμή.

Αυτό μπορούμε να το κάνουμε με πάρα πολλούς τρόπους. Ένας απο αυτούς είναι η τεχνική του Multidimensional Scaling. Η τεχνική αυτή λύνει την εξής ωραία σπαζοκεφαλιά: Γνωρίζοντας μόνο τις αποστάσεις ανάμεσα σε ένα σύνολο απο σημεία σε κάποιο χώρο (Μ διαστάσεων), μπορείς να βρείς τη σχετική θέση των σημείων αυτών σε ένα άλλο χώρο (Ν διαστάσεων, Ν<=Μ), έστω και με κάποιο μικρό (κατα προτίμηση) σφάλμα;

Δεν μας ενδιαφέρει δηλαδή το πώς ακριβώς είναι τοποθετημένα αυτά τα σημεία πραγματικά στον 40διάστατο χώρο τους, αν δημιουργηθεί μια δισδιάστατη απεικόνιση που διατηρεί τις σχετικές αποστάσεις των σημείων τότε αντικρίζουμε ένα (απλό) χάρτη αυτού του (σύνθετου) πολυ-διάστατου τοπίου.

Να ένας "απλός" χάρτης:

Cities Apart
Απο που πάνε για το Vancouver;;;;

Η παραπάνω εικόνα αποτελέι τη "λύση" της προβολής των 40 διαστάσεων σε 2 με τη μέθοδο του Multidimensional Scaling. Εδώ αξίζει να σημειωθεί οτι επειδή το πρόβλημα του ακριβούς ταιριάσματος των αποστάσεων ανάμεσα σε κάθε ζεύγος σημείων μπορεί να είναι αρκετά δύσκολο (ανάλογα με την εφαρμογή), μια υποκατηγορία μεθόδων του Multidimensional Scaling προσπαθεί απλά να "ταιριάξει" την κατάταξη των αποστάσεων παρά τις απόλυτες τιμές τους (Όπου εδώ η "κατάταξη" είναι η σειρά με την οποία εμφανίζονται οι πόλεις στα διαγράμματα του προηγούμενου κειμένου). Μια τέτοια μέθοδος έχει χρησιμοποιηθεί και για τη δημιουργία αυτού του χάρτη.

Μια πρώτη παρατήρηση είναι οτι οι πόλεις που ανήκουν σε εύρωστες οικονομικά χώρες (όπως η Ευρώπη, ο Καναδάς και η Αμερική) βρίσκονται όλες μαζί σε μια κοντινή γειτονιά ενώ οι πόλεις που βρίσκονται σε λιγότερο εύρωστες χώρες είναι πιο αραιά τοποθετημένες. Αυτό σημαίνει οτι ο τρόπος ζωής σε αυτές τις περιοχές έχει χαρακτηριστεί απο τους δείκτες και τη βαθμολόγηση της EIU, ώς περίπου ίδιος. Απο εκεί και περά όμως, οι υπόλοιπες πόλεις είναι λιγότερο προβλέψιμες και μπορεί να υπερτερούν σε μια μικρή ομάδα δεικτών αλλά να υστερούν σε κάποια άλλη.

Στο μεταξύ, γράφοντας κομμάτια αυτού του κειμένου, έληξε και η προθεσμία υποβολής συμμετοχών στον διαγωνισμό Best City Contest και είναι πλεόν δυνατόν να δούμε και την πολύ ενδιαφέρουσα δουλειά που έχει γίνει και απο άλλους χρήστες.

Έτσι λοιπόν, ένα παρόμοιο χάρτη στον οποίο είναι ακόμα πιο προφανής αυτή η διαίρεση δημιούργησε ο Alexander Kosenkov για τον διαγωνισμό και μπορείτε να τον δείτε στο BuzzData.

Η δημιουργία αυτού του χάρτη κάνει λίγο πιο προφανή πια και τα υπόλοιπα ερωτήματα, όπως: Πώς θα μπορούσε το Karachi να γίνει Vancouver; (και πόσο γρήγορα;) Ποιός είναι ο δρόμος της μικρότερης προσπάθειας ώστε με μικρούς μετασχηματισμούς ο τρόπος ζωής σε μια πόλη να προχωρήσει πρός αυτόν μιας άλλης πόλης;

Μικρές υποθέσεις και δοκιμές για τις απαντήσεις στις παραπάνω ερωτήσεις, με έκαναν να συμμετέχω τελικά και εγώ στον διαγωνισμό με ότι μπορούσα να καταφέρω στον διαθέσιμο ελεύθερο χρόνο και πάντα δουλεύοντας με την έννοια της απόστασης και προσπαθόντας να δημιουργήσω μια αντικειμενική κατάταξη (αντί για μια υποκειμενική που θα ήταν βασισμένη σε κάποια αυθαίρετη (ή και δικαιολογημένη) επιλογή δεικτών).

Οι ανυπόμονοι μπορείτε να ρίξετε μια ματιά στη συμμετοχή στο PDF που υπάρχει αναρτημένο στο BuzzData αν και σκοπεύω να γράψω μερικά ακόμα λόγια για τη συμμετοχή σύντ.........

Κάποια στιγμή στο μέλλον!

Σημειώσεις:
*: Η έννοια της απόστασης παραμένει η ίδια όταν ο χώρος συμμορφώνεται με την Ευκλείδια γεωμετρία....Υπάρχουν και γεωμετρίες στις οποίες η συντομότερη απόσταση ΔΕΝ είναι η ευθεία....Γίνεται, γίνεται....Θυμίσου, δεν είναι ανάγκη να το "δείς" για να "πειστείς"...

Λόντρα, Παρίσι, Νιού Γιόρκ...

Λόντρα Παρίσι Νιού Γιόρκ Βουδαπέστη Βιέννη
μπρός την Αθήνα καμμιά σας καμμιά σας δε βγαίνει
γιατ' είναι πάντα γεμάτες με ρόδα οι ποδιές της
κι άσπρες δαντέλες τυλίγουν τις ακρογιαλιές της.
Λόντρα, Παρίσι, Αθήνα
Στίχοι: Μίμη Τραϊφόρου

 
Αυτά τραγουδούσε η Σοφία Βέμπο για την Αθήνα του 1944, λίγο πρίν το τέλος του Δευτέρου Παγκοσμίου Πολέμου και λίγο πριν την αρχή του δικού μας προσωπικού πολέμου, του εμφυλίου.

Πόσο όμως "απέχει" ο τρόπος ζωής στην Αθήνα σήμερα, απο τον τρόπο ζωής στο Παρίσι, τη Βουδαπέστη, τη Βιέννη και άλλες μεγάλες πόλεις το κόσμου; Ποιές δύο πόλεις βρίσκονται στα αντίποδα σημεία του τρόπου ζωής; Πώς μπορούμε να απεικονίσουμε τις διαφορές του τρόπου ζωής σε διάφορες πόλεις στον κόσμο σε μια εικόνα;

Τις απαντήσεις σε αυτές τις ερωτήσεις, μπορούν να μας δώσουν δύο σύνολα δεδομένων που δημοσιεύτηκαν πρόσφατα απο την Economist Intelligence Unit (EIU), στο BuzzData με αφορμή τον διαγωνισμό "Καλύτερη Πόλη Στον Κόσμο - 2012" (Best City In The World Contest - 2012).

Πολύ σύντομα, η EIU έχει ήδη δημιουργήσει ένα δείκτη διαβίωσης που κατατάσει τις πόλεις του κόσμου με βάση 39 παραμετρούς. Οι διαγωνιζόμενοι, καλούνται, με βάση αυτά τα δεδομένα, να δημιουργήσουν ένα νέο δείκτη του τρόπου ή της ποιότητας ζωής των πόλεων αυτών,  ο οποίος πιθανότατα να συμπεριλαμβάνει πρόσθετες παραμέτρους και δεδομένα που ο τρέχων δείκτης αγνοεί.
Για αυτό το λόγο, η EIU, δημοσιεύει μέσω του BuzzData δύο πολύ χρήσιμους πίνακες με διάφορους δείκτες διαβίωσης των πόλεων καθώς επίσης και του κόστους ζωής.


Τα δεδομένα ήταν πολύ ενδιαφέροντα και μια και δυό, εκτός διαγωνισμού, σκάρωσα μερικές απεικονίσεις που μπορείτε να βρείτε στο BuzzData. Γράφω αυτό το κείμενο για να πώ δύο λόγια παραπάνω για το τι δείχνουν αυτές οι απεικονίσεις αλλά και για να παρουσιάσω μια λίγο διαφορετική έκδοση τους.


Παραθέτω εδώ αμέσως τα γραφήματα, μαζί με κάποια πολύ σύντομα επεξηγηματικά σχόλια, ενώ περισσότερες λεπτομέρειες για την επεξεργασία μπορείτε να βρείτε στο τέλος του κειμένου....Όσο για την επιλογή των γραμματοσειρών και των χρωμάτων...Θα πώ ένα μόνο πράγμα:

"Greetings Professor Falken!"


Athens - Greece
Η Αθήνα στον πιο συνηθισμένο της ρόλο, στο κέντρο της παγκόσμιας σκηνής (!)
(Όλες οι εικόνες έχουν δημιουργηθεί με αγνά υλικά και προέρχονται απο τη ψηφιακή φάρμα του ΑΑ)

Και ξεκινάμε με την Αθήνα και το γράφημα που ουσιαστικά ξεκίνησε αυτό το project. Εκ πρώτης όψεως βρίσκεται σε καλή γειτονιά. Την περιστοιχίζουν, σε κάποια απόσταση, πόλεις όπως το Λός Άντζελες, η Βοστώνη, η Βουδαπέστη και πολύ μακριά της η Τρίπολη, η Τεχεράνη και άλλες...Μας λείπει όμως εδώ, ένα μέτρο σύγκρισης...για να ξέρουμε τι εστί "κοντά" και τι "μακριά"...

Vancouver - Canada
   Η γειτονιά του Vancouver - Canada

Να και το μέτρο σύγκρισης! Το Vancouver ήταν μέχρι πολύ πρόσφατα η κορυφαία πόλη στη κατάταξη συνθηκών διαβίωσης της EIU αλλά έχασε απο τη Μελβούρνη. Το Vancouver, μαζί με το Karachi, στο Pakistan, έχουν τη μεγαλύτερη απόσταση σε ποιότητα ζωής (όπως περιγράφεται απο τους δείκτες της EIU).

Karachi - Pakistan
 Και απο το Vancouver, στην άλλη άκρη του κόσμου (και πιθανότατα και του τρόπου ζωής). Karachi - Pakistan

Ναι και το Karachi του οποίου η άμεση γειτονιά είναι το Κατμαντού, το Κολόμπο και το Δελχί...και μάλιστα σε αρκετή απόσταση...Το Karachi έχει τη χαμηλότερη βαθμολογία στους δείκτες διαβίωσης της EIU.

Sofia - Bulgaria
   Να και ένας...γεωγραφικός γείτονας... Sofia - Bulgaria

Μιά και μιλήσαμε για τα άκρα, ας αναφερθούμε και στο "μέσον". Ποιά πόλη δηλαδή είναι περίπου στο μέσο της απόστασης που ορίζεται απο το Vancouver και το Karachi? Και η πόλη αυτή είναι η Σόφια της γειτονικής Βουλγαρίας.


Προφανώς, μπορούμε να δημιουργήσουμε παρόμοιες εικόνες και για τις υπόλοιπες χώρες που περιγράφονται απο τα δεδομένα της EIU. Όμως μπορούμε, με μια πολύ όμορφη τεχνική, να φέρουμε όλες αυτές τις πόλεις και τις πληροφορίες για τις μεταξύ τους αποστάσεις σε μια και μόνο, δισδιάστατη εικόνα. Αυτό όμως θα το δούμε στο επόμενο κείμενο, πολύ σύντομα!



Για όσους έφτασαν ώς εδώ....και θέλουν να πάνε και παρακάτω....Ιδού τα ίνφοζ:
Τα Δεδομένα
Τα συγκεκριμένα δεδομένα που χρησιμοποιήθηκαν ήταν οι δείκτες διαβίωσης της EIU. Πρόκειται για μια σειρά απο 39 δείκτες για 140 πόλεις του κόσμου, ανάμεσα τους και η Αθήνα (για την οποία γίνεται ειδική αναφορά φέτος) που προσπαθούν να ποσοτικοποιήσουν διάφορες απόψεις της διαβίωσης στις πόλεις, όπως "Απειλή στρατιωτικής σύγκρουσης","Τρομοκρατική απειλή", "Διαθεσιμότητα εστιατορίων", "Ποιότητα παροχής ηλεκτρισμού", "Ποιότητα του οδικού δικτύου", "Επίπεδο λογοκρισίας" και άλλους δείκτες. Εδώ υπάρχει ένα λεπτό σημείο που αξίζει να αναφερθεί με μεγαλύτερη λεπτομέρεια: Οι δείκτες αυτοί, βρίσκονται όλοι στην ίδια κλίμακα με τιμές στο διάστημα [1..5] που ανταποκρίνονται στους χαρακτηρισμούς (Αποδεκτό, Ανεκτό, Ενοχλητικό, Ανεπιθύμητο, Απαράδεκτο) αντίστοιχα. Τις τιμές για κάθε πόλη, τις καθορίζει μια επιτροπή αναλυτών της EIU σε συνεργασία με τοπικούς αναλυτές απο την κάθε πόλη. Οι τιμές καθορίζονται σε σχέση με τη Νέα Υόρκη. Εδώ δεν θα μας απασχολήσει το πως ακριβώς γίνεται αυτή η μέτρηση ή αν η κλίμακα των 5 τιμών είναι αρκετή. Η εκτίμηση θεωρείται αντικειμενική και η κλίμακα αρκετή.
Το πολύ καλό στοιχείο που έχουν αυτά τα δεδομένα είναι ακριβώς αυτή η κοινή κλίμακα των 5 αριθμών γιατί αυτό σημαίνει οτι ορίζουν ένα ομοιόμορφο ορθογώνιο παραλληλεπίπεδο 39 - διαστάσεων. Με άλλα λόγια, αν ο κάθε δείκτης ήταν σε μια διαφορετική μονάδα και κλίμακα (για παράδειγμα, Ευρώ, χιλιόμετρα, ώρες, pascal) το παραλληλεπίπεδο δεν θα ήταν ομοιόμορφο και θα έπρεπε και πάλι να βρούμε ένα τρόπο να αντιστοιχίσουμε όλα τα δεδομένα σε ένα κοινό χώρο πρίν μπορούμε να κάνουμε τις οποιεσδήποτε συγκρίσεις.
Η Επεξεργασία
Η επεξεργασία των δεδομένων ήταν αρκετά απλή. Υπενθυμίζεται οτι ο πρωταρχικός σκοπός ήταν να εκτιμηθεί η απόσταση του τρόπου διαβίωσης ανάμεσα στην Αθήνα και τις άλλες πόλεις για τις οποίες υπήρχαν διαθέσιμα δεδομένα, ή πιο γενικά η απόσταση στον τρόπο διαβίωσης ανάμεσα σε οποιεσδήποτε δύο πόλεις. Το σύνολο των αριθμών για κάθε πόλη δημιουργούν ένα διάνυσμα 39 διαστάσεων.
Σκεφτείτε το αυτό, σαν ένα σημείο που θα μας έδινε το GPS, μόνο που απο αυτόν τον πλανήτη που μας έρχονται τα δεδομένα, κάθε σημείο του χώρου ορίζεται απο 39 αριθμούς αντί για τους συνηθισμένους 3 (Γεωγραφικό μήκος, πλάτος, Υψόμετρο) που μας δίνει το GPS επάνω στη Γή.

Ακριβώς με τον ίδιο τρόπο που μπορούμε να υπολογίσουμε την απόσταση μεταξύ δύο σημείων που περιγράφονται απο δυο τριάδες GPS αριθμών, υπολογίζουμε και την απόσταση ανάμεσα σε δυο διανύσματα 39 διαστάσεων. Η απόσταση αυτή είναι η συνηθισμένη Ευκλείδια απόσταση.

Υπολογίζοντας λοιπόν την απόσταση ανάμεσα στα διανύσματα όλων των ζευγών των πόλεων παίρνουμε ένα πίνακα γεμάτο αριθμούς που θα τον βαφτίσουμε "Πίνακα Αποστάσεων". Αυτός ο πίνακας έχει την εξής ωραία ιδιότητα. Επιλέγοντας μια γραμμή που αντιστοιχεί σε μια πολή, μπορεί να μας "μαρτυρήσει" τις αποστάσεις αυτής της πόλης και όλων των άλλων (σε κάθε στήλη της επιλεγμένης γραμμής).
Σκεφτείτε τον Πίνακα Αποστάσεων, σαν τους πίνακες που έχουν οι χάρτες μιας χώρας που δίνουν τις αποστάσεις ανάμεσα στις κυριότερες πόλεις.

Στη συνέχεια, χωρίζουμε τις αποστάσεις σε 10 ζώνες και μετράμε πόσες (και ποιές) πόλεις βρίσκονται στη κάθε ζώνη και απεικονίζουμε το αποτέλεσμα. Αυτό γίνεται με το λεγόμενο Ιστόγραμμα.
Σκεφτείτε το Ιστόγραμμα σαν τα αποτελέσματα των εκλογών, στον οριζόντιο άξονα βρίσκονται οι πολιτικές παρατάξεις και στον κάθετο ο αριθμός ψήφων. Στη δική μας περίπτωση, στον οριζόντιο άξονα βρίσκεται η "απόσταση" και στον κάθετο το πόσες (και ποιές) πόλεις βρίσκονται στη συγκεκριμένη απόσταση απο την εξεταζόμενη πόλη.
Τα Εργαλεία
Χρησιμοποιήθηκε η γλώσσα προγραμματισμού Python μαζί με τις "προσθήκες" Python - Cairo (για τα γραφικά και τις γραμματοσειρές) και την προσθήκη Python - Scipy για την επεξεργασία των αριθμών. Όλα αυτά τα εργαλεία (υψηλής ποιότητας) μαζί με την πλήρη τεκμηρίωση τους βρίσκονται σε ελεύθερη διάθεση. Οι γραμματοσειρές που χρησιμοποιήθηκαν ήταν η πολύ ενδιαφέρουσα (και καινούρια) Averia του Dan Sayers και η καταπληκτική Mainframe απο το Blambot, επίσης ελεύθερα διαθέσιμες. Το post-processing έγινε στο GIMP (πρόγραμμα επεξεργασίας εικόνας.....ναι.....και αυτό ελεύθερο).

Οι Απεικονίσεις
Δεν ήθελα απλά να δείξω μια σειρά απο ιστογράμματα και επειδή και τα δεδομένα μιλάνε για αποστάσεις, αποφάσισα να τα παραστήσω σαν το ηλιακό σύστημα, με την εξεταζόμενη πόλη στη μέση και τις υπόλοιπες πόλεις σαν δορυφόρους γύρω της. Μετά απο μια σειρά απο πειραματισμούς κατέληξα σε δύο πρότυπα που τα ονόμασα "Πάπυρος" (!) και "DEFCON" για προφανής (ελπίζω) λόγους. Το "Πάπυρος" είναι αυτό που εμφανίζεται στο BuzzData και εδώ παρουσιάστηκε το DEFCON.

Οδική Αγγειογραφία...

Blood on the streets runs a river of sadness.
Blood in the streets, it's up to my thigh.
The river runs down the legs of the city;
The women are crying red rivers of weeping.
Peace Frog - Jim Morison (...and the rest of the Doors Of Perception)

Δουλεύοντας πρόσφατα επάνω σε μια ιδέα με Ελληνικά ανοικτά δεδομένα, έγινε σχετικά πιο εύκολο να απεικονίσω ολόκληρο το οδικό δίκτυο. Είπα λοιπόν να παρουσιάσω αυτή την εικόνα στο δικό της χώρο, ανεξάρτητα απο οτιδήποτε (θα / αν) ακολουθήσει, αφού εκτός απο την εντυπωσιακή της όψη απαντάει και σε μια ερώτηση που θα βρίσκεται στη βάση κάθε ανάλυσης του δικτύου: "Τι έκταση περιγράφεται στο αρχείο 'Οδικό Δίκτυο' ;"

Για να δούμε:

Όλοι (σχεδόν) οι δρόμοι που περιλαμβάνονται στο αρχείο 'Οδικό Δίκτυο' χωρίς τη χρήση καμίας χαρτογραφικής προβολής. Οι δρόμοι περιγράφουν το υπόστρωμα πάνω στο οποίο 'μεγάλωσαν' με πολύ μεγάλη λεπτομέρεια...αλλά αυτό είναι αναμενόμενο, ή τουλάχιστον πιο αναμενόμενο απο την αντίστοιχη εικόνα που δημιούργησαν μερικές χιλιάδες τυχαία συμβάντα πυρκαγιών. Τα δεδομένα προέρχονται απο το geodata.gov.gr και η απεικόνιση έχει γίνει με ένα μικρό πρόγραμμα που δημιουργήθηκε για το συγκεκριμένο σκοπό σε Python.

Όπως φαίνεται λοιπόν, καλύπτεται σχεδόν ολόκληρη η χώρα και υπάρχουν όντως ελάχιστες καταγραφές απο το Άγιο Όρος.
Δυστυχώς όμως φαίνεται να υπάρχουν σφάλματα όσο αφορά το ύψος όλων των καταγραφών που κυμαίνεται ανάμεσα στα 16 μέτρα (μικρότερη τιμή) και 55 μέτρα (μεγαλύτερη τιμή). Αυτό είναι λίγο 'ύποπτο' για την εγκυρότητα αυτών των υψών απο τη στιγμή που στο αρχείο περιλαμβάνονται τα Γρεβενά που βρίσκονται σε περίπου 600 μέτρα υψόμετρο*

Η πρώτη προσπάθεια απεικόνισης ήταν καθαρά ασπρόμαυρη. Δρόμοι λευκοί, ζωγραφισμένοι με το ίδιο πάχος, σε μαύρο φόντο. Καθώς όμως κοιτούσα απο κοντά τις αμέτρητες διακλαδώσεις των δρόμων, ο παραλληλισμός με το κυκλοφορικό σύστημα ήταν αναπόφευκτος.

Κάπως έτσι προέκυψε αυτή η "Οδική Αγγειογραφία". Το σύνολο δηλαδή των δρόμων που περιγράφονται στο αρχείο "Οδικό Δίκτυο", εκτός απο τις θαλάσσιες ferry διαδρομές, ζωγραφισμένοι με κόκκινο χρώμα και με μια διαβάθμιση στο πάχος τους ανάλογα με την κατηγορία τους ώστε οι εθνικές οδοί να παρουσιάζονται σαν αρτηρίες και οι μικροί δρόμοι των πόλεων να παρουσιάζονται σαν τριχοειδή αγγεία.

Δύο δίκτυα, τόσο όμοια όσο και διαφορετικά. Το κυκλοφορικό σύστημα μεταφέρει το αίμα που εξυπηρετεί μια σειρά απο ζωτικές λειτουργίες για ένα οργανισμό ενώ το Οδικό Δίκτυο μιας χώρας διευκολύνει την κυκλοφορία οχημάτων που συμβάλουν στην ανάπτυξη της..

Σε κάποιους απο αυτούς τους δρόμους βέβαια, το χώμα βάφεται κόκκινο...κάθε χρόνο. Σύμφωνα με τα διαθέσιμα στοιχεία της τροχαίας, πέρυσι (2010), συνέβησαν 1162 θανατηφόρα τροχαία δυστυχήματα στο οδικό δίκτυο που κόστισαν (με ένα πολύπλοκο τρόπο) 1281 ανθρώπους. Κατα μέσο όρο, το κυκλοφορικό σύστημα ενός ενήλικα περιέχει περίπου 5 λίτρα αίμα. Δηλαδή ούτε λίγο ούτε πολύ, 1281 * 5 = 6405 λίτρα αίμα(**).

Ένας δρόμος, με πλάτος 6 μέτρα όπου το αίμα θα μπορούσε να τρέξει σε 10 εκατοστά βάθος, θα είχε μήκος 6405 / 6 * 0.1 = 10675 μέτρα...Δέκα χιλιόμετρα... a river of sadness.


*: Περισσότερες πόλεις της Ελλάδας ταξινομημένες καθ' ύψος.
**: Το γρήγορο πέρασμα απο λίτρα σε κυβικά μέτρα γίνεται εδώ παρατηρόντας οτι η πυκνότητα του αίματος είναι πολύ κοντά στη πυκνότητα του νερού, στους 4 βαθμούς κελσίου (και 1 ατμόσφαιρα πίεσης) όπου 1000 λίτρα νερού θα καταλάμβαναν χώρο ενός κυβικού μέτρου.

Ένα Τσιγάρο Δρόμος...

Το μαύρο περίγραμμα της Ελλάδας, στο προηγούμενο κείμενο, δεν ήταν καθόλου όμορφο θέαμα. Γι' αυτό σε αυτό το κείμενο θα προσθέσουμε λίγο χρώμα συνδιάζοντας τις τοποθεσίες των πυρκαγιών με τις τοποθεσίες των πυροσβεστικών υπηρεσιών.

Με αυτό το τρόπο θα μπορούσαμε να απαντήσουμε ερωτήματα όπως "Ποιά είναι, κατα προσέγγιση, η μέση απόσταση μιας πυρκαγιάς απο ένα πυροσβεστικό σταθμό; (άρα και περίπου σε πόση ώρα μπορούν να αντιδράσουν;)" αλλά και "Ομαδοποιόντας τις πυρκαγιές ανα σταθμό με βάση το κριτήριο της μικρότερης απόστασης, πώς διαμορφώνεται το "φορτίο" τους;".

Στη πορεία βέβαια, δυστυχώς, θα απαντήσουμε και λίγο πιο στοιχειώδης ερωτήσεις όπως "Που είναι η Χαλκίδα;", "Που είναι η Κόρινθος;", "Που είναι τα Κύθηρα;"...

Ομαδοποίηση συμβάντων ανα πυροσβεστικό σταθμό σύμφωνα με το κριτήριο της μικρότερης απόστασης (βλέπε κείμενο). Τα κόκκινα άστρα υποδηλώνουν τις διαθέσιμες θέσεις των πυροσβεστικών υπηρεσιών και οι χρωματιστές περιοχές γύρω τους, τα συμβάντα που τους αντιστοιχούν. Δεδομένα: geodata.gov.gr

Ο παραπάνω χάρτης δημιουργήθηκε υπολογίζοντας την απόσταση κάθε πυρκαγιάς απο όλες τις Πυροσβεστικές Υπηρεσίες και καταχωρόντας τη στην κοντινότερη. Οι συντεταγμένες έχουν προβληθεί σύμφωνα με τη προβολή Miller (*) και ως απόσταση εννοείται η απόσταση σε ευθεία γραμμή.

Όπως φαίνεται και στο χάρτη, δεν καλύπτουν όλοι οι σταθμοί, την ίδια επιφάνεια. Γι' αυτό, πρίν γίνει οποιαδήποτε σύγκριση ανάμεσα τους, ο αριθμός των συμβάντων που τους αντιστοιχούν έχει διαιρεθεί με την επιφάνεια που ορίζουν οι πυρκαγιές στην περίμετρο της περιοχής τους (convex hull). Η διόρθωση αυτή είναι απαραίτητη αφού όσο μεγαλύτερη είναι μια περιοχή τόσο πιο εκτεθειμένη είναι σε περισσότερα συμβάντα που μπορεί να οδηγήσουν σε μια πυρκαγιά.

Έτσι λοιπόν, η πιο "φορτωμένη" Πυροσβεστική Υπηρεσία φαίνεται να είναι αυτή της Σκοπέλου με 2.19 πυρκαγιές ανα τετραγωνικό χιλιόμετρο. Κατα (διά)μεσο όρο αντιμετωπίζονται πυρκαγίες σε απόσταση περίπου 4km (3.92) απο τη διαθέσιμη θέση της τοπικής Πυροσβεστικής Υπηρεσίας με τη κοντινότερη πυρκαγιά να έχει συμβεί σε περίπου 369 (369.5) μέτρα (!) και τη πιο απομακρυσμένη να έχει συμβεί σε περίπου 14km (14.01).

Ακολουθεί η Πυροσβεστική Υπηρεσία Φιλιππιάδας με 2.00 πυρκαγιές ανα τετραγωνικό χιλιόμετρο (Κοντινότερη:3.57 km, Απομακρυσμένη:13.17km ) και το Top 3 ολοκληρώνει η Πυροσβεστική Υπηρεσία Καλαμάτας με 1.82 πυρκαγίες ανα τετραγωνικό χιλιόμετρο (Κοντινότερη:1.53 km, Απομακρυσμένη:7.54 km)

Οι τρείς λιγότερο φορτωμένοι σταθμοί είναι το Πυροσβεστικό Κλιμάκιο Λίνδου με 0.009 πυρκαγίες ανα τετραγωνικό χιλιόμετρο, το Πυροσβεστικό Κλιμάκιο Αστροχωρίου με 0.022 πυρκαγίες ανα τετραγωνικό χιλιόμετρο και το Πυροσβεστικό Κλιμάκιο Νάξου με 0.024 πυρκαγίες ανα τετραγωνικό χιλιόμετρο.

Δυστυχώς, κάποιες απο τις παραπάνω πληροφορίες δεν ανταποκρίνονται στη πραγματικότητα, ειδικά όσο αφορά νησιά :-(. Ας δούμε γιατί:

Οι τοποθεσίες των πυροσβεστικών υπηρεσιών και κλιμακίων(ε) προέρχονται απο το αρχείο "Δημόσια Κτήρια". Το αρχείο αυτό περιγράφει αναλυτικά τις τοποθεσίες όλων (;) των δημόσιων κτηρίων της χώρας αλλά και τη χρήση τους. Απο αυτό το αρχείο, απομονώθηκαν όλες οι εγγραφές των οποίων το πεδίο typos είχε την τιμή "ΠΥΡΟΣΒΕΣΤΙΚΗ" (**).

Υπάρχουν 169 τέτοιες εγγραφές οι οποίες όμως δεν περιγράφουν μόνο τις τοποθεσίες των πυροσβεστικών σταθμών. Υπάρχουν για παραδείγμα, τα κτήρια της Πυροσβεστικής Ακαδημίας, ένα Ταμείο Επικουρικής Ασφάλισης Και Πρόνοιας Απασχολούμενων Στα Σώματα Ασφαλείας, καθώς επίσης και πυροσβεστικά κλιμάκια αεροσκαφών στην Αγχίαλο, τη Τρίπολη, τη Καλαμάτα, το Άκτιο και αλλού.

Προφανώς, αυτές οι τοποθεσίες δεν συμμετέχουν άμεσα στη κατάσβεση πυρκαγιών στις γύρω περιοχές γι' αυτό και απομακρύνθηκαν. Οι μόνες εξαιρέσεις σε αυτό το κανόνα ήταν το Ηράκλειο της Κρήτης και η Καβάλα όπου σαν τοπικές Πυροσβεστικές Υπηρεσίες άφησα αυτές των λιμανιών (Πυροσβεστική Υπηρεσία Λιμένα Καβαλάς και Πυροσβεστική Υπηρεσία Λιμένα Ηρακλείου) μόνο και μόνο επειδή δεν ορίζονταν οι τοπικές υπηρεσίες.

Έτσι μένει κανείς με 137 τοπικές Πυροσβεστικές Υπηρεσίες και Κλιμάκια ανα την Ελλάδα. Όμως, σύμφωνα με την εξαιρετική σελίδα για το Πυροσβεστικό Σώμα στην Wikipedia, υπάρχουν περίπου 300 Πυροσβεστικές Υπηρεσίες ανά την Ελλάδα.

Άρα, το αρχείο των Δημόσιων Κτηρίων περιέχει μόλις το 45.6% του συνόλου των κτηρίων και δυστυχώς, 44 απο τις 137 Πυροσβεστικές Υπηρεσίες είναι τοποθετημένες σε εντελώς λάθος γεωγραφικές θέσεις. Που σημαίνει οτι τελικά είναι (περίπου) σωστά καταχωρημένο το ((137-44)/300)*100 = 31%

Μερικά γουστόζικα λαθάκια ήταν τα εξής: Η Πυροσβεστική Υπηρεσία Χαλκίδας τοποθετείται κάπου στον Άγιο Ιωάννη Ρέντη στον Πειραιά, ενώ η Πυροσβεστική Υπηρεσία Κορίνθου κάπου μέσα στη Χαλκίδα (!). Η Πυροσβεστική Υπηρεσία Κυθήρων τοποθετείται στον Μυλοπόταμο Δράμας (!!!!!) ενώ η Πυροσβεστική Υπηρεσία Πάρου έχει τοποθετηθεί στην Ιθάκη. Ένα θλιβερό σφάλμα είναι αυτό της Πυροσβεστικής Ακαδημίας που τοποθετείται σε κάποια Βίλλια στο Νομό Ηλείας (Πελοπόνησος) ενώ βρίσκεται στα Βίλια της Αττικής (!)

Οι εσφαλμένες αυτές τοποθεσίες διορθώθηκαν χειροκίνητα και κατα προσέγγιση πρίν απο τη δημιουργία του παραπάνω χάρτη.

Τα ελλειπή αυτά δεδομένα, παραμορφώνουν τις παραπάνω πληροφορίες ειδικά σε οτι αφορά τα νησιά. Ήδη τα αετήσια μάτια κάποιων απο εσάς ίσως έχουν παρατηρήσει οτι η Πυροσβεστική Υπηρεσία Λίνδου (στη Ρόδο) φαίνεται να αντιμετωπίζει και τις πυρκαγίες της Καρπάθου όπως και η Πυροσβεστική Υπηρεσία Λιμένα Καβάλας φαίνεται να αντιμετωπίζει και τα συμβάντα της Θάσου. Αν υπήρχαν όλες οι διαθέσιμες πληροφορίες, οι πυρκαγιές θα ομαδοποιόντουσαν ωραία γύρω απο κάθε Πυροσβεστική Υπηρεσία και τα σφάλματα θα ήταν μικρότερα.

Εδώ θα μπορούσε Κάποιος να πεί, οτι η ομαδοποίηση θα μπορούσε να γίνει με βάση τα περιθώρια των νομών (επίσης διαθέσιμα απο το geodata.gov.gr) και θα είχε και δίκιο. Επίσης, ο ίδιος Κάποιος μπορεί να πεί οτι το κριτήριο της πιο σύντομης απόστασης σε ευθεία είναι πολύ απλοϊκό και οτι θα πρέπει να ληφθεί υπ' όψην και το οδικό δίκτυο.....Αυτό θα είναι όντως πολύ ενδιαφέρον (Κάποιε) και θα το δούμε σε κάποιο απο τα επόμενα κείμενα.

Ποιά πιστεύετε οτι είναι η πιο κοντινή απόσταση πυρκαγιάς απο Πυροσβεστική Υπηρεσία που έχει καταγραφεί;; (με την όποια ακρίβεια τέλος πάντων)...Θα μάθουμε στο επόμενο.


Σημειώσεις:
*) Η προβολή Miller επιλέχτηκε ώστε να διατηρηθούν οι αποστάσεις ανάμεσα στα καταγεγραμμένα σημεία αλλά και τα εμβαδά των περιοχών (τουλάχιστον στο επίπεδο)

**) Δυστυχώς το πεδίο typos διχάζεται σε "ΠΥΡΟΣΒΕΣΤΙΚΗ" και "ΠΥΡΟΣΒΕΣΤΙΚΗ ΥΠΗΡΕΣΙΑ". Παρ' όλα αυτά, όλες οι εγγραφές με typos == "ΠΥΡΟΣΒΕΣΤΙΚΗ ΥΠΗΡΕΣΙΑ", περίπου 44, δεν περιέχουν γεωγραφικό μήκος και πλάτος.

Όχι Άλλο Κάρβουνο...

Το Your Greece Is On Fire, παρουσίασε την εξέλιξη 15929 πυρκαγιών σε διάστημα 585 ημερών μέσα σε 5 λεπτά. Σε αυτό το πόστ, οι πρωταγωνιστές της υπερπαραγωγής, υποκλίνονται μπροστά μας....όλοι μαζί.


Μπορείτε να αναγνωρίσετε αυτή τη χώρα;
(Η εικόνα είναι βασισμένη σε δεδομένα απο το geodata.gov.gr)


Η παραπάνω εικόνα συνοψίζει μόνο τις πυρκαγιές απο το "Ιστορικό Αγροτοδασικών Πυρκαγιών" για τις οποίες είναι γνωστή η τοποθεσία τους ανεξάρτητα απο το πότε συνέβησαν.

Η εικόνα σχηματίστηκε πολύ απλά παίρνοντας το γεωγραφικό μήκος του συμβάντος σαν τη συντεταγμένη Χ και το γεωγραφικό πλάτος του, σαν τη συντεταγμένη Υ για κάθ μια απο τις τελείες που την αποτελούν. Δεν έχει εφαρμοστεί καμία μετατροπή και καμία διόρθωση (*), γι' αυτό και η Ελλάδα απεικονίζεται λίγο συμπιεσμένη στη διεύθυνση Βορράς-Νότος.

Παρ' όλα αυτά, η ανάλυση με την οποία αποδίδεται η χώρα είναι εκπληκτική.

Διαγράφονται ξεκάθαρα νησιά όπως η Κρήτη, η Εύβοια, η Κέρκυρα, η Ρόδος, η Κάρπαθος, η Λέσβος και η Χίος, όχι μόνο απο το περίγραμμα τους αλλά και απο χαρακτηριστικά όπως κόλποι και ψηλά βουνά.

Στηn Κρήτη για παράδειγμα, στο νομό Χανίων, διακρίνονται τα Λευκά Όρη και στο νομό Ηρακλείου, ο Ψηλορείτης (**). Δεν είναι προφανές (ακόμα) αλλά στο νομό Αγίου Νικολάου διακρίνεται και το οροπέδιο του Λασηθίου. Αυτές οι περιοχές δεν έχουν σχεδόν καθόλου βλάστηση και έτσι εμφανίζοντε σαν άσπρες τρύπες περικυκλωμένες απο μαύρες τελείες που ορίζουν περιοχές με...περισσότερα καύσιμα.

Λιγότερο προφανής αλλά και πάλι αναγνωρίσιμος είναι ο κόλπος της Καλλονής (με τη καλή έννοια) στη Λέσβο αλλά και τα..."πόδια" της Χαλκιδικής.

Όταν μπορείς να ξεχωρίσεις τοποθεσίες και σχηματισμούς στην Ελλάδα, χωρίς κανένα άλλο σημείο αναφοράς παρα μόνο κοιτόντας τις τοποθεσίες των πυρκαγιών.....κάτι δεν έχει πάει καθόλου καλά....Το νού μας λοιπόν αλλά και, κατα κάποιο τρόπο...περαστικά μας επίσης!


Απο το επόμενο άρθρο θα αρχίσουμε να βλέπουμε τις ιστορίες που αναδύονται συνδιάζοντας περισσότερα απο ένα σύνολα δεδομένων.



Σημειώσεις:


Οι πυρκαγιές με δεδομένη τη θέση τους αποτελούν μόλις το 14% (13.7) του συνόλου των καταγεγραμμένων πυρκαγιών στο Ιστορικό Αγροτοδασικών Πυρκαγιών.


*)
Προφανώς, οι συντεταγμένες των πυρκαγιών προέρχονται απο την επιφάνεια μιας έλλειψης αλλά απεικονίζονται σε ένα επίπεδο
(τι θα πεί "Ποιάς έλλειψης;"...της Γής.). Αυτός είναι και ο λόγος που η εικόνα του άρθρου εμφανίζεται περισσότερο "παραμορφωμένη" απ' όσο σε άλλους χάρτες . Η ελαχιστοποίηση αυτής της παραμόρφωσης είναι το αντίκειμενο των "Χαρτογραφικών Προβολών" (απο τις οποίες το παρόν άρθρο δεν χρησιμοποιεί καμία όπως τονίζεται παραπάνω)

**) Εκτός απο τα μεγάλα βουνά που αναφέρονται παραπάνω στην Κρήτη μάλλον διακρίνεται ακόμα και κάποια κορυφή απο τα Αστερούσια Όρη, Νοτιο-Ανατολικά του Ψηλορείτη. Όποιος γνωρίζει ας φωτίσει πρός τα εδώ.

Πύρο - Τέχνημα

Στο προηγούμενο κείμενο, είδαμε την εικόνα που περιγράφουν 115986 καταγραφές πυρκαγιών στην Ελλάδα, σε διάστημα 9.5 περίπου χρόνων. Σήμερα θα δούμε το ιστορικό των Ελληνικών πυρκαγιών απο μια άλλη άποψη...

Αν αυτοί οι αριθμοί, είχαν σχήμα και φωνή, τι θα είχαν να μας πούν;


Η "Καλή Φάση" productions παρουσιάζει την πεντάλεπτη υπερπαραγωγή "Your Greece Is On Fire" (Η Ελλάδα Στα Κάρβουνα*), σε σκηνοθεσία AA. Πρωταγωνιστεί η (ρεαλιστική) θεατρική ομάδα "Πύρινες Γλώσσες" . Στο ρόλο του Πυροσβέστη, το Ελληνικό Πυροσβεστικό Σώμα. Τραγικός Χορός: Οι Ιθαγενείς. Απο Μηχανής Θεός: Canadair CL415. Σκηνικά: Μητέρα Φύση. Δεδομένα: geodata.gov.gr.




Το παραπάνω video παρουσιάζει μέσα σε 5 λέπτα, τα δεδομένα απο 15929 συμβάντα που έχουν καταγραφεί σε διάστημα 583 ημερών (27-05-2008 ώς 31-12-2009) στην Ελλάδα.

Ο λόγος που επέλεξα να παρουσιάσω μόνο αυτές τις πυρκαγιές είναι το οτι η όποια καταγραφή των συντεταγμένων των συμβάντων στο "Ιστορικό Αγροτοδασικών Πυρκαγιών" ξεκινάει μόλις στις 27-05-2009...

Κάθε μια κόκκινη κουκίδα στον παραπάνω χάρτη αντιπροσωπεύει ένα συμβάν. Η χρονική διάρκεια κατα την οποία η κουκίδα παραμένει αναμμένη επάνω στον χάρτη είναι ανάλογη με τη πραγματική χρονική διάρκεια της πυρκαγιάς. Η ακτίνα της κάθε κουκίδας ΔΕΝ είναι ανάλογη με την έκταση της πυρκαγιάς επειδή, λόγω της κλίμακας του χάρτη, θα διακρίνονταν ελάχιστες πυρκαγιές. Όλες οι κουκίδες αρχίζουν απο μια ακτίνα 4 μονάδων απόστασης και καταλήγουν σε μια ακτίνα 8 μονάδων απόστασης σε ρυθμό που υποβάλεται απο τη πραγματική τους διάρκεια. Οι αριθμοί που εμφανίζονται Βόρειο-Δυτικά της Κρήτης, δείχνουν την αντίστοιχη ημερομηνία με τη μορφή Μήνας / Έτος.

Παρακολουθείτε όλες (15929) τις πυρκαγιές. Ακούτε όμως, ΜΟΝΟ τις πυρκαγιές που έχουν επηρρεάσει πάνω απο 30 στρέμματα γής. Για κάθε τέτοια πυρκαγιά, ακούγεται ο ηλεκτρονικός ήχος ενός τηλεφώνου που αντιπροσωπεύει μια επείγουσα κλήση. Το όριο των 30 στρεμμάτων επιλέχτηκε μετά απο δοκιμές επειδή ο όγκος των πυρκαγιών ανα μονάδα χρόνου είναι πολύ μεγάλος σε σχέση με το μήκος του video.

Η παρουσίαση των πυρκαγιών με αυτό τον άμεσο τρόπο, μεταφέρει σχεδόν όλα τα χαρακτηριστικά που περιγράφονται στο προηγούμενο κείμενο. Διακρίνονται καθαρά, ο πολύ μεγάλος αριθμός πυρκαγιών και (ελπίζω) το πόσο σοβαρό πρόβλημα αποτελούν οι πυρκαγιές. Διακρίνοντε επίσης, το "άλμα" στη συχνότητα των συμβάντων μετά τον Μάϊο και η μεγάλη διάρκεια των πυρκαγιών που χαρακτηρίζουν τον Αύγουστο.

Η παρουσίαση μεταφέρει όμως και άλλο ένα, δυναμικό, χαρακτηριστικό που δεν είναι απαραίτητα προφανές στα προηγούμενα συνοπτικά γραφήματα...Οι πυρκαγιές, έρχονται σε κύματα...Με συχνότητα και πλάτος. Έχουν τη δική τους χροιά αν τους δώσεις φωνή και είναι μια απο τις μελωδίες, που μας συνοδεύουν στο ταξίδι μας γύρω απο τον Ήλιο. Αλλά αυτό είναι...μια άλλη ιστορία.


Τίτλοι Τέλους
Η παρουσίαση δημιουργήθηκε στο Processing
Πρόσβαση σε χάρτες μέσω Modest Maps (για Processing)
Ο χάρτης της Ελλάδας προέρχεται απο το Microsoft Maps
Αναπαραγωγή, Μίξη Ήχων μέσω Minim
Ο ήχος του τηλεφώνου προέρχεται απο το Freesound.org
Το video καταγράφηκε με το Camstudio :-/
Η επεξεργασία του video έγινε στο OpenShot

*Ο Τίτλος του video είναι εμπνευσμένος απο το τραγούδι "Your Sex Is On Fire" των Kings Of Leon. Η φράση "Η Ελλάδα Στα Κάρβουνα" προέρχεται απο το ομώνυμο τραγούδι του Τζίμι Πανούση.

Κάψε, Κάψε...Τι Θα Κάψεις;

Δέκα χρόνια πυρκαγιές στην Ελλάδα. Πόσες πυρκαγιές μπορεί να σημαίνει αυτό; Ποιές χρονιές ήταν οι χειρότερες; Ποιοί μήνες είναι οι πιο επικίνδυνοι; Ποιές ώρες της ημέρας είναι οι πιο επικίνδυνες; Πόση ώρα μπορεί να έχει δουλέψει η Πυροσβεστική επάνω σε αυτές τις πυρκαγιές;

Οι απαντήσεις ίσως να μην είναι προφανής όταν (τα καλοκαίρια συνήθως) μαθαίνουμε για μια μεγάλη πυρκαγιά που κατακαίει την τάδε περιοχή και ίσως για άλλη μια κάπου αλλού και μετά απο δυό τρείς ημέρες άλλη μια μεγάλη πυρκαγιά. Ίσως τότε και να μονολογούμε "κάθε χρόνο τα ίδια" και να θυμόμαστε και 5-6 μεγάλες πυρκαγιές των τελευταίων χρόνων (κάποιες απο τις οποίες είναι πολύ πιθανό οτι μας έχουν επηρρεάσει άμεσα). Πόσο πλήρεις μπορεί να είναι αυτή η εικόνα; Πόσο συνειδητοποιούμε κάποια μεγέθη;

Τέτοιου είδους ερωτήματα μας επιτρέπει να απαντήσουμε το "Ιστορικό Αγροτοδασικών Πυρκαγιών" που είναι διαθέσιμο απο τη σελίδα των Ελληνικών ανοικτών δημόσιων δεδομένων και στα οποία θα ρίξουμε μια πιο κοντινή ματιά σε μια σειρά απο πόστ.

Ήδη απο το προηγούμενο πόστ, είδαμε την (μακριά) προεργασία που χρειάζεται το αρχείο για να γίνει χρήσιμο. Σε αυτό το πόστ θα ρίξουμε μια πρώτη ματιά στους αριθμούς και την ιστοριά που περιγράφουν.

Ο σκοπός αυτού του κειμένου δεν είναι να ερμηνεύσει τη κατάσταση και να μπλεχτεί σε αηδιαστικές κοματικές διαμάχες του στύλ "δεν φταίμε εμείς, φταίνε οι άλλοι" (...άλλωστε ένα είναι το κόμα). Ο σκοπός του κειμένου είναι να περιγράψει τα δεδομένα απο ένα φαινόμενο που μας (ή θα έπρεπε να μας) απασχολεί ό λ ο υ ς.
!!!Η παρουσίαση που ακολουθεί έχει δημιουργηθεί με βάση την παραδοχή οτι τα στοιχεία που προέκυψαν απο το βήμα της προεργασίας είναι αληθή. Δηλαδή, ανταποκρίνοντε στη πραγματικότητα και δεν περιέχουν σφάλματα!!!
Για περισσότερες λεπτομέρειες σχετικά με το πως δημιουργήθηκαν οι πληροφορίες που παρουσιάζοντε εδώ, δείτε στις σημειώσεις στο τέλος του κειμένου. Εδώ απλά θα ήθελα να πώ οτι εκτός απο τους συνοπτικούς αριθμούς που περιγράφουν το σύνολο των πυρκαγιών θα μας απασχολήσουν και τρείς ποσότητες συναρτήσει του χρόνου:
  • Συνολικός Αριθμός Συμβάντων
  • Συνολική Διάρκεια Πυρκαγιών (Ώρες)
  • Συνολική Καμμένη Έκταση (Στρέματα)
Πάντα με την προυπόθεση οτι οι αριθμοί ανταποκρίνονται στην πραγματικότητα, μένει κανείς άναυδος στη θέα τους...

Μέσω του παρακάτω γραφήματος μπορείτε να εξερευνήσετε την ετήσια κατανομή των πυρκαγιών καθώς επίσης και τη συνολική επηρρεασμένη έκταση ανα τύπο πυρκαγιάς. Έχω συμπεριλάβει αναλυτικές οδηγίες χρήσης στο περιθώριο αλλά ίσως χρειαστείτε μια μικρή περίοδο προσαρμογής για να μπορέσετε να εξερευνήσετε τα δεδομένα με άνεση. Ίσως ακούγεται πιο δύσκολο απο οτι πραγματικά είναι. Αν το γράφημα δεν απεικονίζεται σωστά μέσα στο blog είναι διαθέσιμο και εδώ

10 Χρόνια Πυρκαγιές Στην Ελλάδα (Ανα Τύπο)


Μέσα σε 9.5 περίπου χρόνια (η καταγραφή ξεκινάει απο τις 03/05/1999), έχουν αντιμετωπιστεί 115986 πυρκαγιές με συνολικό χρόνο καταπολέμησης 627755 ώρες και συνολική επηρρεασμένη έκταση 6350226 στρέματα. Λέω επηρρεασμένη και όχι καμμένη, γιατί όλοι οι τύποι καταγεγραμένων αγροτοδασικών εκτάσεων (εκτός απο τους σκουπιδότοπους) μπορεί να ανακάμπτουν σιγά-σιγά και στις δικές τους χρονικές κλίμακες...αν δεν έχουν στο μεταξύ αλλάξει χρήση.

Η συνολική επηρρεασμένη έκταση, είναι αναμφίβολα μεγάλη. Το εκπληκτικό όμως είναι οτι όλη αυτή η καμμένη έκταση ΔΕΝ ανήκει εξ ολοκλήρου σε δάση και δασικές εκτάσεις.

Το 53% (52.8) επί το συνόλου είναι όντως δάση και δασικές εκτάσεις αλλά το 31% (30.82) είναι καλλιέργειες.

Συγκεκριμένα, οι καλλιέργειες αποτελούν σταθερά περίπου το 1/3 των επηρρεασμένων εκτάσεων ετησίως και στα έτη 2001 (59.4%) ,2002 (50.5%), 2004 (34.02%) είναι ο τύπος πυρκαγιάς με τη μεγαλύτερη επιρρεασμένη έκταση σε σχέση με όλους τους άλλους υπόλοιπους καταγεγραμένους τύπους σε ένα έτος.

Αυτό μου προκαλεί ιδιαίτερη εντύπωση επειδή, ειδικά στο θέμα των καλλιεργιών, εκτός απο όλα τα άλλα έξοδα κατάσβεσης, προστίθεται και η συνολική ζημιά του καλλιεργητή.

Εδώ βέβαια υπάρχει ένα λεπτό σημείο το οποίο είναι καλό να ξεκαθαριστεί.

Μπορεί μια πυρκαγιά, να έχει ξεκινήσει απο ένα δάσος και να έχει κάψει και καλλιέργειες ή το αντίθετο (ή οποιοσδήποτε συνδιασμός ανάμεσα στις καταγεγραμένες κατηγορίες). Σε αυτή τη περίπτωση, καταγράφονται για το ίδιο συμβάν, όλες οι επιμέρους επιρρεασμένες εκτάσεις. Αυτό σημαίνει, οτι ανάμεσα στους τύπους των εκτάσεων αναμένεται να υπάρχει μια αλληλεξάρτηση. Αυτή η αλληλεξάρτηση, αξίζει ένα πόστ απο μόνη της. Εδώ όμως θα ήθελα πολύ σύντομα να πώ ότι το "Ιστορικό Αγροτοδασικών Πυρκαγιών" περιέχει 14216 συμβάντα (12.25% επι του συνόλου) όπου η επιρρεασμένη έκταση είναι μοιρασμένη σε διαφορετικούς τύπους πυρκαγιών. Άρα σε γενικές γραμμές, το ποσοστό αλληλεξάρτησης αναμένεται να είναι μικρό, ειδικά αν αναλογιστεί κανείς οτι πρόκειται για 12.25% κατανεμημένο σε 9.5 χρόνια (το 1999 είναι "μισερό" όπως είπαμε).


Ένα άλλο σημείο το οποίο παρουσιάζει ενδιαφέρον είναι το πότε ξεκινάνε αυτές οι πυρκαγιές αλλά και η συνολική τους διάρκεια. Αυτές οι πληροφορίες είναι διαθέσιμες απο τη παρακάτω απεικόνηση. (Αν δεν απεικονίζεται σωστά μέσα στο blog είναι διαθέσιμη και εδώ)

10 Χρόνια Πυρκαγιές Στην Ελλάδα

Η γενική παρατήρηση είναι φυσικά οτι οι πιο επικίνδυνοι μήνες είναι οι καλοκαιρινοί (Ιούνιος, Ιούλιος, Αύγουστος) οι οποίοι συγκεντρώνουν σταθερά σε όλα τα έτη, πάνω απο 50% του ετήσιου συνολικού αριθμού συμβάντων. Παρ' όλα αυτά, υπάρχει και μια μικρή έξαρση στον αριθμό των συμβάντων γύρω απο τον Μάρτιο.

Έτσι λοιπόν, το προφίλ της πιο καταστροφικής πυρκαγιάς όπως προκύπτει απο το σύνολο των δεδομένων είναι η πυρκαγιά που ξεκινάει Αύγουστο, στις 14:00 το μεσημέρι, θα διαρκέσει κατα μέσο όρο περίπου 11 ώρες (10.92) και θα επιρρεάσει κατα μέσο όρο περίπου 352 (351.82) στρέμματα (συνήθως δάσους ή δασικής έκτασης).

Εδώ υπάρχει άλλο ένα λεπτό σημείο. Κάποιος μπορεί να πεί οτι οι πυρκαγιές του 2000 και του 2007 είναι εξέχοντα γεγονότα κρίνοντας απο την ιδιαίτερα μεγάλη καμένη έκταση. Αυτές οι δύο χρονιές συγκεντρώνουν το 70% (69.97) της συνολικής επιρρεασμένης έκτασης (1599929 και 2843803 στρέμματα αντίστοιχα επι συνόλου 6350226 επιρρεασμένων στρεμμάτων).

Αυτός ο κάποιος μπορεί να πεί οτι για αυτό το λόγο, η εικόνα ίσως είναι παραμορφωμένη πρός υψηλές τιμές και ακόμα οτι αυτό χειροτερεύει ακόμα περισσότερο απο το γεγονός οτι το 1999 συμβάλει μόνο τους καλοκαιρινούς του μήνες.

Επιλέγοντας λοιπόν μόνο τις χρονολογίες 2001-2006 και 2008-2009 (shift και πολλαπλά κλίκ στην ετήσια κατανομή) το προφίλ της καταστροφικής πυρκαγιάς...αλλάζει.

Με βάση τα δεδομένα απο πυρκαγιές 8 ετών, το προφίλ της καταστροφικής πυρκαγιάς γίνεται: Πυρκαγιά που ξεκινάει τον Αύγουστο στις 20:00 το βράδυ, διαρκεί κατα μέσο όρο 6 ώρες (6.17) και επιρρεάζει κατά μέσο όρο 235 (234.60) στρέμματα (συνήθως δασών και δασικών εκτάσεων)

Θα ήθελα να κλείσω αυτό το πόστ, παραθέτοντας το τρίτο και τελευταίο συνοπτικό διάγραμμα. Αυτό περιγράφει τις τάσεις που φαίνοντε να υπάρχουν μέσα στους αριθμούς συναρτήσει του χρόνου. Δηλαδή, μέσα σε X χρόνια, πώς φαίνοντε να μεταβάλλοντε τα μεγέθη των συμβάντων, συνολικής επιρρεασμένης έκτασης και συνολικής διάρκειας; Αυξάνονται με το χρόνο; Μήπως μειώνονται;

Οι τάσεις που απεικονίζοντε σε αυτό το διάγραμμα είναι βασισμένες στο μοντέλο της καλύτερα τοποθετημένης γραμμής πάνω απο τα δεδομένα ΜΟΝΟ για τα 8 έτη που αναφέροντε παραπάνω για τον ίδιο λόγο της ελαχιστοποίησης της παραμόρφωσης...Αν και για κάποια μεγέθη δεν είναι κάν απαραίτητο να ταιριάξουμε μια γραμμή γιατί οι τάσεις είναι προφανείς. Αν η παρουσίαση δεν απεικονίζεται σωστά μέσα στο blog υπάρχει διαθέσιμη και έδω.

Τάσεις Μεγεθών Συναρτήσει Του Χρόνου


Πολύ σύντομα, μέσα απο δεδομένα 8 ετών, φαίνεται οτι ο συνολικός αριθμός συμβάντων μειώνεται με ρυθμό 184 (-183.66) συμβάντα το χρόνο. Όμως, η συνολική επιρρεασμένη έκταση αυξάνεται κατά 21617 στρέμματα το χρόνο και μαζί της αυξάνεται και ο συνολικός αριθμός διάρκειας των συμβάντων με ρυθμό 1231 (1231.15) ώρες το χρόνο. Δηλαδή, απο τα 8 χρόνια στα οποία βασίζοντε οι τάσεις φαίνεται οτι όσο περνάει ο χρόνος παρατηρούντε λιγότερες πυρκαγιές αλλά μεγαλύτερες.



Μπορεί κανείς να συνεχίσει να γράφει για ώρες κοιτόντας τους αριθμούς (πάντα με την προυπόθεση οτι ανταποκρίνονται όντως στη πραγματικότητα), να υπολογίζει δείκτες και να εξακολουθεί να μένει άναυδος. Παρ' όλα αυτά νομίζω πως αυτό το πόστ κατέληξε τεράστιο και έχει έρθει η στιγμή να βάλω μια τελεία εδώ, σταματώντας μόνο σε αυτή τη συνοπτική παρουσίαση του συνόλου των πυρκαγιών. Σίγουρα, κάποιοι απο τους παραπάνω υπολογισμούς μπορούν να πραγματοποιηθούν με διαφορετικούς τρόπους για να βελτοιωθεί η ακρίβεια των αποτελέσματα, όμως σε αυτό το πόστ το ενδιαφέρον ήταν εστιασμένο σε μια πρώτη ματιά στην ιστορία που περιγράφουν τα δεδομένα.

Περισσότερα πράγματα που θα μπορούσαμε να κάνουμε με αυτά τα δεδομένα θα ήταν για παράδειγμα να εξάγουμε μηνιαία και ωριαία προφίλ πυρκαγιών ανάλογα με τον τύπο τους και να μελετήσουμε τις διαφορές τους ή να μελετήσουμε ποιές περιοχές έχουν καεί και ξανακαεί περισσότερες απο μια φορές ή πόσες φορές συμπίπτουν πυρκαγιές όπου επιρρεάζοντε και δάσοι και σκουπιδότοποι ή να εστιαστούμε μόνο στις πυρκαγιές που έχουν επιρρεάσει δασικές εκτάσεις και δάση ή να φέρουμε μέσα και τα δεδομένα των ορίων των νομών και να δούμε κατανομές ανα νομό...μετά να δούμε τις κατανομές ανα νομό και χρόνο και τελικά να δούμε ποιοί νομοί καίγοντε πιο συχνά το καλοκαίρι και ποιοί νομοί καίγοντε πιο συχνά το χειμώνα.......και πολλά άλλα όμορφα.

Για εμένα, προσοχή! ακολουθεί προσωπική άποψη, αυτό που κατάφερε να κάνει αυτή η ανάλυση ήταν να με κάνει να συνειδητοποιήσω το μέγεθος του προβλήματος των πυρκαγιών στην Ελλάδα. Υπάρχει διαφορά ανάμεσα στο "Γνωρίζω" και στο "Συνειδητοποιώ".

Νομίζω οτι αυτή είναι και η αξία του να έχεις αυτούς τους αριθμούς ανοικτούς (και σε μια μορφή που να μπορεί να τις διαβάσει μηχανή!) με ότι προβλήματα μπορεί να έχουν...Ναί, το ξέρω, κάποιος πάλι, θα πεί οτι μπορεί οι αριθμοί να είναι εντελώς λάθος...Πάντα θα υπάρχει αυτός ο κίνδυνος.

Μόνο και μόνο ο συνολικός αριθμός ωρών, ο οποίος όσο αφορά τη πυροσβεστική μεταφράζεται άμεσα σε εργατοώρες, προκαλεί σόκ. Πόσο μάλλον, η συνολική καμμένη έκταση.

Οι πυρκαγιές καταστρέφουν τον τόπο (με οτι οικολογικές συνέπειες μπορεί να έχει αυτό) αλλά καταπίνουν και πάρα πολλά λεφτά. Μαζί με το ανθρώπινο δυναμικό τρέχουν στα κατσάβραχα και τις βουνοπλαγιές, φορτηγά τραβώντας μαζί τους τόνους νερό, αεροπλάνα, και ειδικά οχήματα με υψηλότατο λειτουργικό κόστος (και φυσικά φθορές...που επίσης θα μας κοστίσουν).

Ένα Canadair - CL415 καταπίνει 840 λίτρα καύσιμο την ώρα σε ευθεία πτήση...Αν το είχα και ήθελα να το κρατήσω στον ουρανό για 1 ώρα, θα έπρεπε να πληρώσω περίπου1839 ευρώ με σημερινές τιμές (01/10/2010), ΜΟΝΟ για καύσιμα...Και αυτό είναι αφού θα το είχα αγοράσει για 35 εκατομμύρια δολάρια...Και σίγουρα, όταν το CL415 έχει φορτώσει τους περίπου 6 τόνους νερό και ξεκινάει την απογείωση μέσα απο τη θάλασσα απαιτεί περισσότερα απο 840 λίτρα καύσιμο την ώρα. (όποιος μπορεί να βρεί στοιχεία για το "δικό μας" CL215 ας μιλήσει τώρα και ας μη σωπάσει για πάντα).
Το Canadair CL415 όπως και τα περισσότερα αεροπλάνα πρός το παρόν, χρειάζεται και πλήρωμα για να πετάξει όπως επίσης και ασφάλεια και πλήρωμα εδάφους και ανταλακτικά.

Δεν ξέρω πόσο μπορεί να είναι ΜΟΝΟ το συνολικό οικονομικό κόστος που μας έχουν επιβάλει αυτές οι φωτιές, όμως θα έχει "πλάκα" αν μπορέσουμε να το υπολογίσουμε για να βάλουμε πάλι τα 500ευρα στη σειρά να δούμε που μπορεί να φτάσουν. Αυτό που σίγουρα δεν έχει καμία πλάκα πάντως είναι και το ανθρώπινο κόστος που πολλές φορές συνοδεύει κάποια συμβάντα.

Το κόστος για αυτές τις πυρκαγιές των περασμένων 9.5 χρόνων το "πληρώσαμε" και...πάνε αυτά τα λεφτά και τι καλά που ήταν όταν τα είχαμε...Το 2020, να είμαστε καλά και ακόμα εδώ, που θα έχουν φτάσει οι αριθμοί;

Δεν ξέρω. Δεν μπορώ να ξέρω. Αλλά η Πυροσβεστική έχει κάτι φυλαδιάκια ακόμα και σε pdf μορφή διαθέσιμα απο το website της. Και μπορούμε να τους ρίξουμε μια ματιά με ελάχιστο κόστος μόνο και μόνο για να έχουμε μια στοιχειώδη γνώση του τι μπορούμε να κάνουμε απο τη δική μας πλευρά (που είμαστε περισσότεροι απο τους πυροσβέστες και παντού στην Ελλάδα). Για όσους δεν το κατάλαβαν, με αυτό το τελευταίο σχόλιο ΔΕΝ προσπαθώ να δικαιολογήσω ούτε να χαϊδέψω κανέναν. Προσπαθώ να προβάλω το οτι ίσως μπορούμε να συμβάλουμε κι εμείς παραπάνω απο όσο νομίζουμε στην αντιμετώπιση των πυρκαγιών και του κόστους τους. Μια τσουγκράνα κοστίζει (ευτυχώς ακόμα) λιγότερο απο ένα Canadair.

Υπάρχουν μερικά ακόμα πράγματα που θα προκύψουν απο τα συγκεκριμένα δεδομένα των πυρκαγιών αλλά και απο τα υπόλοιπα διαθέσιμα δεδομένα απο το geodata.gov.gr και ίσως τα δούμε μαζί σε επόμενα πόστ.



Σημειώσεις:
Η ομάδα διαχείρησης του website των ανοικτών δεδομένων, έχει απαντήσει στα λάθη που αναφέροντε στο προηγούμενο post και έχει προσφερθεί να ανεβάσει τα διορθωμένα δεδομένα στο website. Μέχρι να γίνει αυτό, όποιος επιθυμεί και το πλήρες αρχικό dataset και το ενδιάμεσο που περιγράφεται παρα κάτω ας μου στείλει ένα email. Τα δεδομένα, διατίθενται με την ίδια Creative Commons άδεια που αναφέρεται στο website των ανοικτών δεδομένων.


Τρία είναι τα μεγέθη που μας απασχόλησαν σε αυτό το πόστ:
  • Συνολικός Αριθμός Συμβάντων
  • Συνολική Διάρκεια Πυρκαγιών (Ώρες)
  • Συνολική Καμμένη Έκταση (Στρέματα)
Και τα τρία παραπάνω μεγέθη, συναρτήσει του χρόνου. Για αυτό το σκοπό δημιουργείται ένας νέος πίνακας ο οποίος προκύπτει απο τη σύνοψη των 115986 εγγραφών ώς εξής:

"Μέτρα τις πυρκαγιές, διάρκεια πυρκαγιών σε ώρες, έκταση κατά τύπο πυρκαγιάς και συνόψισε τις μετρήσεις κατα χρόνο και μήνα της ημερομηνίας έναρξης".

Έτσι λοιπόν οι απαντήσεις στις παραπάνω ερωτήσεις (και περισσότερες) δίνοντε απο ένα πίνακα με μόλις 2832 εγγραφές...Και εδώ το ερώτημα είναι...Πώς να σας παρουσιάσω αυτές τις τρείς ποσότητες (Αριθμός Συμβάντων, Διάρκεια Συμβάντων και Έκταση Συμβάντος) σύν άλλη μια ποσότητα (τον χρόνο), με όσο το δυνατόν καλύτερο τρόπο;

Για τη παρουσίαση των δεδομένων ήμουν ανάμεσα στις online εφαρμογές Tableau Public και Many Eyes. Και οι δύο υπηρεσίες δουλεύουν με παρόμοιο τρόπο. Ο χρήστης "ανεβάζει" ένα απλό text αρχείο που περιέχει τις ποσότητες που θέλει να απεικονίσει και επιλέγει τον τρόπο απεικόνισης απο τους πολλούς διαθέσιμους. Και η απεικόνιση αλλά και τα δεδομένα παραμένουν ανοικτά και διαθέσιμα σε όλους.

Για τη συγκεκριμένη απεικόνηση, επέλεξα το Tableau Public, κυρίως επειδή δεν είχε κανένα πρόβλημα με τους Ελληνικούς χαρακτήρες, είναι βασισμένο σε Javascript (χαρά στο κουράγιο τους!) αλλά και επειδή μου άρεσε το αποτέλεσμα που παράγει οπτικά.

Πύρ, CSV...Κι "Αλίκμωνας" (!)

Φέτος το καλοκαίρι ξεκίνησε τη λειτουργία της η σελίδα Ελληνικών Δημόσιων Ανοικτών (Γεω)Δεδομένων και προσφέρει ήδη μια μεγάλη συλλογή απο πίνακες για διάφορα μεγέθη απο τον Ελληνικό χώρο. Ένας απο αυτούς τους πίνακες είναι και ένα ιστορικό που καλύπτει δέκα περίπου χρόνια (1999-2009) πυρκαγιών στην Ελλάδα.

Νομίζω οτι μέσα απο αυτά τα στοιχεία μας δίνεται μια μοναδική ευκαιρία να παρακολουθήσουμε την ιστορία που περιγράφουν οι αριθμοί και να αναλογιστούμε κάποια μεγέθη και τις επιπτώσεις τους.

Μέχρι όμως να φτάσουμε να μιλάμε για τα μεγέθη και τις πληροφορίες που προκύπτουν μέσα απο τα δεδομένα και να "διαβάσουμε" καθαρά την ιστορία που προσπαθούν να μας πούν, θα πρέπει πρώτα να διορθώσουμε λίγο το "κείμενο" της. Και αυτό είναι κάτι που (δυστυχώς) παίρνει.....λίγο.....χρόνο.

Έτσι στο σημερινό πόστ θα ρίξουμε μια ματιά στην προεργασία που χρειάζεται το αρχείο με τις πυρκαγιές ενω σε επόμενα πόστ θα δούμε τι μας λένε οι αριθμοί.

Το αρχείο με το ιστορικό των Ελληνικών πυρκαγιών είναι διαθέσιμο απο αυτή τη σελίδα. Περιέχει 16 στήλες με τα εξής πεδία: Δήμος (ολογράφως), Περιοχή(ολογράφως), Ημερομηνία Εκδήλωσης Πυρκαγιάς, Ώρα Εκδήλωσης Πυρκαγιάς, Ημερομηνία Κατάσβεσης Πυρκαγιάς, Ώρα Κατάσβεσης Πυρκαγιάς.

Ακολουθούν 8 πεδία που περιγράφουν τον τύπο της καμένης έκτασης σαν: Δάση, Δασικές Εκτάσεις, Άλση, Χορτολιβαδικές Εκτάσεις, Γεωργικές εκτάσεις, Υπόλοιπες Καλλιέργειες (sic) και Σκουπιδότοποι. Η λίστα των πεδίων καταλήγει με τα δύο πεδία του γεωγραφικού μήκους και πλάτους στο σύστημα WGS84. Το αρχείο περιέχει 116074 εγγραφές.

Μια πρώτη απόπειρα να υπολογίσω κάποιες στοιχειώδεις ποσότητες, παρήγαγε κάποια περίεργα αποτελέσματα. Τελικά κατέληξα να αντιμετωπίζω τα εξής προβλήματα, που θα προσπαθήσω να περιγράψω όσο πιο σύντομα και αποτελεσματικά γίνεται:
  1. Το διαθέσιμο αρχείο με κατάληξη .XLS δεν περιείχε γεωγραφικές συντεταγμένες (μήκος, πλάτος) για ΚΑΝΕΝΑ συμβάν. Αντίθετα, το αρχείο με κατάληξη .CSV (διαθέσιμο απο την ίδια σελίδα και αναφερόμενο στο ίδιο dataset) περιείχε γεωγραφικές συντεταγμένες για τις περισσότερες πυρκαγιές των ετών 2008,2009. Γι΄αυτό το λόγο, αποφάσισα να εστιαστώ στο .CSV αρχείο. Παρεμπιπτόντως, το ποσοστό των πυρκαγιών για τις οποίες έχουν καταγραφεί γεωγραφικές συντεταγμένες είναι 13.7% (Επι του συνόλου των εγγραφών).

  2. Τα πεδία Δήμος και Περιοχή περιείχαν διάφορους μη επιτρεπόμενους χαρακτήρες. Για παράδειγμα, σε συμβολοσειρές που ορίζοντε απο δύο quotes στην αρχή και το τέλος της συμβολοσειράς, υπήρχαν πολλαπλά. Χαρακτηριστικό παράδειγμα η γραμμή 41948:
    ΑΝΤΙΓΟΝΙΔΩΝ;"""Δ.Δ. ΚΕΦΑΛΟΧΩΡΙΟΥ """"ΑΛΙΚΜΩΝΑΣ""""""";

    Τον ΑΛΙΚΜΩΝΑ τον παραβλέπω πρός το παρόν...(Για τα ορθογραφικά λάθη θα μιλήσουμε αργότερα). Επίσης, μέσα στη συμβολοσειρά, υπήρχαν χαρακτήρες όπως επιπλέον κενά και tabs. Αυτά δεν είναι φυσικά μη επιτρεπόμενοι χαρακτήρες μέσα σε μια συμβολοσειρά που καθορίζεται απο quotes (") αλλά έτσι κι αλλιώς για να γίνει η απεικόνιση της, θα αφαιρεθούν αυτοί οι χαρακτήρες. Οπότε γιατί να μην λείπουν απο την αρχή;

  3. Το βασικότερο πρόβλημα το έχει η στήλη "Ημερομηνία Κατάσβεσης Πυρκαγιας". Πρίν εξηγήσω αναλυτικά τι συμβαίνει με αυτή τη στήλη θα ήθελα να τονίσω οτι είναι ένα σημαντικό στοιχείο γιατί μαζί με την ημερομηνία και ώρα εκδήλωσης της πυρκαγιάς μπορούμε να υπολογίσουμε τη διάρκεια της, έστω και κατα προσέγγιση. Οπότε, αξίζει τον κόπο να διορθωθεί παρά να αποκοπεί.
    Δυστυχώς, τα προβλήματα εδώ είναι πολλά:

    Α) Η ημερομήνια είναι καταγεγραμένη με ένα τρόπο που να μπορεί να την καταλάβει ένας υπολογιστής μόνο στο 40% των εγγραφών. Στο 60%, η ημέρα και ο μήνας είναι τοποθετημένα σε λάθος θέση. Δηλαδή ενώ ένας υπολογιστής έχει διαβάσει 812 εγγραφές και έχει συμπεράνει οτι η ημερομηνία δίνεται με τη σύμβαση ΜΕΡΑ/ΜΗΝΑΣ/ΧΡΟΝΟΣ, στην 813η εγγραφή βρίσκει μια συμβολοσειρά που περιγράφει μια ημερομηνία ώς ΜΗΝΑΣ/ΜΕΡΑ/ΧΡΟΝΟΣ την οποία και απορίπτει. Οι αριθμοί που δίνοντε είναι ακριβείς. Η πρώτη εσφαλμένη ημερομηνία βρίσκεται στη γραμμή 813. Οι ημερομηνίες διορθώθηκαν αυτόματα χωρίζοντας τη συμβολοσειρά στο χαρακτήρα "/" και τοποθετόντας τους αριθμούς στη σωστή τους θέση. Δυστυχώς, οι ημερομηνίες και οι ώρες δεν είναι εκφρασμένες με το κατάλληλο standard που θα ήταν ο ευκολότερος τρόπος για μια μηχανή να τις καταλάβει.

    Β) Παρ' όλα αυτά υπάρχουν 41 εγγραφές με ημερομηνία κατάσβεσης πάνω απο 27 ημέρες και μέχρι και 1 χρόνο αργότερα!
    Υπάρχουν 198 εγγραφές με ημερομηνία κατάσβεσης ΠΡΙΝ την ημερομηνία εκδήλωσης και τέλος, υπάρχουν και 35 εγγραφές οι οποίες έχουν την ίδια ακριβώς ημερομηνία και ώρα εκδήλώσης και κατάσβεσης....Αυτά τα λάθη δεν έχουν προκληθεί απο την αντιμετάθεση της ημέρας και του μήνα αλλά είναι "ορθογραφικά". Δηλαδή ημερομηνίες στις οποίες έχει γίνει λάθος εισαγωγή δεδομένων στην ημερομηνία κατάσβεσης. Όλες οι παραπάνω εγγραφές διορθώθηκαν χειροκίνητα αλλά και αυτόματα. Χειροκίνητα διορθώθηκαν οι 41 εγγραφές με διάρκεια πάνω απο 27 ημέρες γιατί κάποιες είχαν όντως μεγάλη διάρκεια, συμπεριλαμβανομένων των μεγάλων πυρκαγιών του 2007 και δεν άξιζε απλά να τις αποκλείσω απο την ανάλυση. Αυτόματα διορθώθηκαν οι πυρκαγίες με αρνητική χρονολογία. Αυτές στη πλειονότητα τους ήταν μικρές πυρκαγίες με έκταση μέχρι και 5 στρέματα και ελάχιστες πάνω απο 100. Αυτές οι (μικρές) πυρκαγιές διορθώθηκαν αυτόματα, σύμφωνα με στοιχεία απο άλλες πυρκαγιές συγκρίσιμου μεγέθους και η διάρκεια τους δεν ξεπερνά τη μία ώρα.

  4. Επίσης υπάρχουν ορθογραφικά λάθη και σε άλλες στήλες, λάθη εισαγωγής και διπλές καταχωρήσεις. Αυτά τα λάθη φανερώνουν οτι η καταχώρηση των στοιχείων δεν έχει γίνει με βάση κάποιο τυποποιημένο "λεξικό". Για παράδειγμα, αλλού ένας δήμος αναφέρεται ώς "Δ. Χαλκιδέων" και αλλού ώς "Χαλκίδας" (!). Δυστυχώς δεν αναφέρεται ο νομός μέσα στον οποίο εκδηλώθηκε η πυρκαγιά, πράγμα περίεργο γιατί αυτό το πεδίο φαίνεται να υπάρχει στα δεδομένα που είναι διαθέσιμα απο το website του Πυροσβεστικού Σώματος.

    Μέσα σε αυτά τα λάθη, θα ήθελα να συμπεριλάβω και πυρκαγιές για τις οποίες τα πεδία "Δήμος" ή / και "Περιοχή" είναι απλά κενά και ταυτόχρονα δεν δίνεται το γεωγραφικό μήκος και πλάτος. Υπάρχουν 56 τέτοιες πυρκαγιές χωρίς "Δήμο" ΚΑΙ "Περιοχή" και 919 στις οποίες δεν αναφέρεται το ένα ή το άλλο πεδίο. Σε αυτές τις περιπτώσεις δεν είναι προφανές το πού εκδηλώθηκε η πυρκαγιά. Για παράδειγμα, στη γραμμή 99345 αναφέρεται η περιοχή "ΨΙΛΙΤΣΑ" και στη γραμμή 100050 αναφέρεται η περιοχή "ΒΟΥΝΙ". Αυτές οι τοποθεσίες ΔΕΝ είναι προφανείς, ούτε κάν στο Google Maps το οποίο θα μπορούσαμε να χρησιμοποιήσουμε για να πάρουμε κατα προσέγγιση το που εκδηλώθηκε η φωτιά. Θα μπορούσα να αποκλείσω και αυτές τις πυρκαγιές αλλά είναι πάρα πολλές και είναι όλες μαζεμένες ανάμεσα στο 2008 και 2009.

    Οι διπλές καταχωρήσεις (87 τον αριθμό) βρέθηκαν με τη βοήθεια του MD5 hash επάνω στη συμβολοσειρά που προκύπτει απο τη συνένωση όλων των πεδίων και αφαιρέθηκαν. Μερικά παραδείγματα: Γραμμές 3666-3669, 90920 - 90967 και άλλες...Δυστυχώς οι καταχωρήσεις αυτές δεν επαναλαμβάνοντε σε διαδοχικές θέσεις.

  5. Υπάρχουν ασάφειες σε πεδία. Για παράδειγμα, ποιά είναι η διαφορά ανάμεσα στα "Δάση" και τις "Δασικές Εκτάσεις"; Δυστυχώς αυτές οι λεπτομέρειες δεν αναφέροντε στα μεταδεδομένα ή μέσα στο αρχείο.
Τα λάθη αυτά έχουν αναφερθεί και στη σελίδα των Ανοικτών Δεδομένων, μέσω του email που δίνεται εκεί.

Εύχομαι, το site των ανοικτών δεδομένων να βελτοιωθεί με το πέρασμα του χρόνου, όχι μόνο όσο αφορά τη λειτουργικότητα του αλλά και το περιεχόμενο.

Στο επόμενο πόστ θα δούμε, τι μας λένε τελικά αυτοί οι αριθμοί...Αλήθεια, πόση ώρα θα λέγατε οτι μπορεί να απασχολείται η πυροσβεστική μέσα σε ένα χρόνο στη κατάσβεση πυρκαγιών;
top