Πύρ, CSV...Κι "Αλίκμωνας" (!)

Φέτος το καλοκαίρι ξεκίνησε τη λειτουργία της η σελίδα Ελληνικών Δημόσιων Ανοικτών (Γεω)Δεδομένων και προσφέρει ήδη μια μεγάλη συλλογή απο πίνακες για διάφορα μεγέθη απο τον Ελληνικό χώρο. Ένας απο αυτούς τους πίνακες είναι και ένα ιστορικό που καλύπτει δέκα περίπου χρόνια (1999-2009) πυρκαγιών στην Ελλάδα.

Νομίζω οτι μέσα απο αυτά τα στοιχεία μας δίνεται μια μοναδική ευκαιρία να παρακολουθήσουμε την ιστορία που περιγράφουν οι αριθμοί και να αναλογιστούμε κάποια μεγέθη και τις επιπτώσεις τους.

Μέχρι όμως να φτάσουμε να μιλάμε για τα μεγέθη και τις πληροφορίες που προκύπτουν μέσα απο τα δεδομένα και να "διαβάσουμε" καθαρά την ιστορία που προσπαθούν να μας πούν, θα πρέπει πρώτα να διορθώσουμε λίγο το "κείμενο" της. Και αυτό είναι κάτι που (δυστυχώς) παίρνει.....λίγο.....χρόνο.

Έτσι στο σημερινό πόστ θα ρίξουμε μια ματιά στην προεργασία που χρειάζεται το αρχείο με τις πυρκαγιές ενω σε επόμενα πόστ θα δούμε τι μας λένε οι αριθμοί.

Το αρχείο με το ιστορικό των Ελληνικών πυρκαγιών είναι διαθέσιμο απο αυτή τη σελίδα. Περιέχει 16 στήλες με τα εξής πεδία: Δήμος (ολογράφως), Περιοχή(ολογράφως), Ημερομηνία Εκδήλωσης Πυρκαγιάς, Ώρα Εκδήλωσης Πυρκαγιάς, Ημερομηνία Κατάσβεσης Πυρκαγιάς, Ώρα Κατάσβεσης Πυρκαγιάς.

Ακολουθούν 8 πεδία που περιγράφουν τον τύπο της καμένης έκτασης σαν: Δάση, Δασικές Εκτάσεις, Άλση, Χορτολιβαδικές Εκτάσεις, Γεωργικές εκτάσεις, Υπόλοιπες Καλλιέργειες (sic) και Σκουπιδότοποι. Η λίστα των πεδίων καταλήγει με τα δύο πεδία του γεωγραφικού μήκους και πλάτους στο σύστημα WGS84. Το αρχείο περιέχει 116074 εγγραφές.

Μια πρώτη απόπειρα να υπολογίσω κάποιες στοιχειώδεις ποσότητες, παρήγαγε κάποια περίεργα αποτελέσματα. Τελικά κατέληξα να αντιμετωπίζω τα εξής προβλήματα, που θα προσπαθήσω να περιγράψω όσο πιο σύντομα και αποτελεσματικά γίνεται:
  1. Το διαθέσιμο αρχείο με κατάληξη .XLS δεν περιείχε γεωγραφικές συντεταγμένες (μήκος, πλάτος) για ΚΑΝΕΝΑ συμβάν. Αντίθετα, το αρχείο με κατάληξη .CSV (διαθέσιμο απο την ίδια σελίδα και αναφερόμενο στο ίδιο dataset) περιείχε γεωγραφικές συντεταγμένες για τις περισσότερες πυρκαγιές των ετών 2008,2009. Γι΄αυτό το λόγο, αποφάσισα να εστιαστώ στο .CSV αρχείο. Παρεμπιπτόντως, το ποσοστό των πυρκαγιών για τις οποίες έχουν καταγραφεί γεωγραφικές συντεταγμένες είναι 13.7% (Επι του συνόλου των εγγραφών).

  2. Τα πεδία Δήμος και Περιοχή περιείχαν διάφορους μη επιτρεπόμενους χαρακτήρες. Για παράδειγμα, σε συμβολοσειρές που ορίζοντε απο δύο quotes στην αρχή και το τέλος της συμβολοσειράς, υπήρχαν πολλαπλά. Χαρακτηριστικό παράδειγμα η γραμμή 41948:
    ΑΝΤΙΓΟΝΙΔΩΝ;"""Δ.Δ. ΚΕΦΑΛΟΧΩΡΙΟΥ """"ΑΛΙΚΜΩΝΑΣ""""""";

    Τον ΑΛΙΚΜΩΝΑ τον παραβλέπω πρός το παρόν...(Για τα ορθογραφικά λάθη θα μιλήσουμε αργότερα). Επίσης, μέσα στη συμβολοσειρά, υπήρχαν χαρακτήρες όπως επιπλέον κενά και tabs. Αυτά δεν είναι φυσικά μη επιτρεπόμενοι χαρακτήρες μέσα σε μια συμβολοσειρά που καθορίζεται απο quotes (") αλλά έτσι κι αλλιώς για να γίνει η απεικόνιση της, θα αφαιρεθούν αυτοί οι χαρακτήρες. Οπότε γιατί να μην λείπουν απο την αρχή;

  3. Το βασικότερο πρόβλημα το έχει η στήλη "Ημερομηνία Κατάσβεσης Πυρκαγιας". Πρίν εξηγήσω αναλυτικά τι συμβαίνει με αυτή τη στήλη θα ήθελα να τονίσω οτι είναι ένα σημαντικό στοιχείο γιατί μαζί με την ημερομηνία και ώρα εκδήλωσης της πυρκαγιάς μπορούμε να υπολογίσουμε τη διάρκεια της, έστω και κατα προσέγγιση. Οπότε, αξίζει τον κόπο να διορθωθεί παρά να αποκοπεί.
    Δυστυχώς, τα προβλήματα εδώ είναι πολλά:

    Α) Η ημερομήνια είναι καταγεγραμένη με ένα τρόπο που να μπορεί να την καταλάβει ένας υπολογιστής μόνο στο 40% των εγγραφών. Στο 60%, η ημέρα και ο μήνας είναι τοποθετημένα σε λάθος θέση. Δηλαδή ενώ ένας υπολογιστής έχει διαβάσει 812 εγγραφές και έχει συμπεράνει οτι η ημερομηνία δίνεται με τη σύμβαση ΜΕΡΑ/ΜΗΝΑΣ/ΧΡΟΝΟΣ, στην 813η εγγραφή βρίσκει μια συμβολοσειρά που περιγράφει μια ημερομηνία ώς ΜΗΝΑΣ/ΜΕΡΑ/ΧΡΟΝΟΣ την οποία και απορίπτει. Οι αριθμοί που δίνοντε είναι ακριβείς. Η πρώτη εσφαλμένη ημερομηνία βρίσκεται στη γραμμή 813. Οι ημερομηνίες διορθώθηκαν αυτόματα χωρίζοντας τη συμβολοσειρά στο χαρακτήρα "/" και τοποθετόντας τους αριθμούς στη σωστή τους θέση. Δυστυχώς, οι ημερομηνίες και οι ώρες δεν είναι εκφρασμένες με το κατάλληλο standard που θα ήταν ο ευκολότερος τρόπος για μια μηχανή να τις καταλάβει.

    Β) Παρ' όλα αυτά υπάρχουν 41 εγγραφές με ημερομηνία κατάσβεσης πάνω απο 27 ημέρες και μέχρι και 1 χρόνο αργότερα!
    Υπάρχουν 198 εγγραφές με ημερομηνία κατάσβεσης ΠΡΙΝ την ημερομηνία εκδήλωσης και τέλος, υπάρχουν και 35 εγγραφές οι οποίες έχουν την ίδια ακριβώς ημερομηνία και ώρα εκδήλώσης και κατάσβεσης....Αυτά τα λάθη δεν έχουν προκληθεί απο την αντιμετάθεση της ημέρας και του μήνα αλλά είναι "ορθογραφικά". Δηλαδή ημερομηνίες στις οποίες έχει γίνει λάθος εισαγωγή δεδομένων στην ημερομηνία κατάσβεσης. Όλες οι παραπάνω εγγραφές διορθώθηκαν χειροκίνητα αλλά και αυτόματα. Χειροκίνητα διορθώθηκαν οι 41 εγγραφές με διάρκεια πάνω απο 27 ημέρες γιατί κάποιες είχαν όντως μεγάλη διάρκεια, συμπεριλαμβανομένων των μεγάλων πυρκαγιών του 2007 και δεν άξιζε απλά να τις αποκλείσω απο την ανάλυση. Αυτόματα διορθώθηκαν οι πυρκαγίες με αρνητική χρονολογία. Αυτές στη πλειονότητα τους ήταν μικρές πυρκαγίες με έκταση μέχρι και 5 στρέματα και ελάχιστες πάνω απο 100. Αυτές οι (μικρές) πυρκαγιές διορθώθηκαν αυτόματα, σύμφωνα με στοιχεία απο άλλες πυρκαγιές συγκρίσιμου μεγέθους και η διάρκεια τους δεν ξεπερνά τη μία ώρα.

  4. Επίσης υπάρχουν ορθογραφικά λάθη και σε άλλες στήλες, λάθη εισαγωγής και διπλές καταχωρήσεις. Αυτά τα λάθη φανερώνουν οτι η καταχώρηση των στοιχείων δεν έχει γίνει με βάση κάποιο τυποποιημένο "λεξικό". Για παράδειγμα, αλλού ένας δήμος αναφέρεται ώς "Δ. Χαλκιδέων" και αλλού ώς "Χαλκίδας" (!). Δυστυχώς δεν αναφέρεται ο νομός μέσα στον οποίο εκδηλώθηκε η πυρκαγιά, πράγμα περίεργο γιατί αυτό το πεδίο φαίνεται να υπάρχει στα δεδομένα που είναι διαθέσιμα απο το website του Πυροσβεστικού Σώματος.

    Μέσα σε αυτά τα λάθη, θα ήθελα να συμπεριλάβω και πυρκαγιές για τις οποίες τα πεδία "Δήμος" ή / και "Περιοχή" είναι απλά κενά και ταυτόχρονα δεν δίνεται το γεωγραφικό μήκος και πλάτος. Υπάρχουν 56 τέτοιες πυρκαγιές χωρίς "Δήμο" ΚΑΙ "Περιοχή" και 919 στις οποίες δεν αναφέρεται το ένα ή το άλλο πεδίο. Σε αυτές τις περιπτώσεις δεν είναι προφανές το πού εκδηλώθηκε η πυρκαγιά. Για παράδειγμα, στη γραμμή 99345 αναφέρεται η περιοχή "ΨΙΛΙΤΣΑ" και στη γραμμή 100050 αναφέρεται η περιοχή "ΒΟΥΝΙ". Αυτές οι τοποθεσίες ΔΕΝ είναι προφανείς, ούτε κάν στο Google Maps το οποίο θα μπορούσαμε να χρησιμοποιήσουμε για να πάρουμε κατα προσέγγιση το που εκδηλώθηκε η φωτιά. Θα μπορούσα να αποκλείσω και αυτές τις πυρκαγιές αλλά είναι πάρα πολλές και είναι όλες μαζεμένες ανάμεσα στο 2008 και 2009.

    Οι διπλές καταχωρήσεις (87 τον αριθμό) βρέθηκαν με τη βοήθεια του MD5 hash επάνω στη συμβολοσειρά που προκύπτει απο τη συνένωση όλων των πεδίων και αφαιρέθηκαν. Μερικά παραδείγματα: Γραμμές 3666-3669, 90920 - 90967 και άλλες...Δυστυχώς οι καταχωρήσεις αυτές δεν επαναλαμβάνοντε σε διαδοχικές θέσεις.

  5. Υπάρχουν ασάφειες σε πεδία. Για παράδειγμα, ποιά είναι η διαφορά ανάμεσα στα "Δάση" και τις "Δασικές Εκτάσεις"; Δυστυχώς αυτές οι λεπτομέρειες δεν αναφέροντε στα μεταδεδομένα ή μέσα στο αρχείο.
Τα λάθη αυτά έχουν αναφερθεί και στη σελίδα των Ανοικτών Δεδομένων, μέσω του email που δίνεται εκεί.

Εύχομαι, το site των ανοικτών δεδομένων να βελτοιωθεί με το πέρασμα του χρόνου, όχι μόνο όσο αφορά τη λειτουργικότητα του αλλά και το περιεχόμενο.

Στο επόμενο πόστ θα δούμε, τι μας λένε τελικά αυτοί οι αριθμοί...Αλήθεια, πόση ώρα θα λέγατε οτι μπορεί να απασχολείται η πυροσβεστική μέσα σε ένα χρόνο στη κατάσβεση πυρκαγιών;

Plane Spotting Στη Χαλκίδα...

Plane Spotting: Με αυτό τον όρο χαρακτηρίζεται η παρατήρηση και καταγραφή των αριθμών νηολογίου αεροσκαφών όπως ανεμόπλανα, αερόστατα, αερόπλοια, ελικόπτερα, υπερελαφρά και μηχανοκίνητα. Ο σκοπός αυτής της διαδικασίας (ή αυτής της ασχολίας) είναι άγνωστος.


Η Χαλκίδα δεν έχει αεροδρόμιο. Η πιο δημοφιλής εξήγηση για αυτό, είναι οτι η πόλη βρίσκεται πολύ κοντά στον Διεθνή Αερολιμένα Αθηνών, Ελ. Βενιζέλ. Παρ' όλα αυτά, η Χαλκίδα έχει...ένα αεροπλάνο. Αυτό:

Ο "Ντακότας" σε διαμόρφωση προσγείωσης και πιθανότατα στη...τελική φάση της προσέγγισης
(Όλες οι φωτογραφίες προέρχοντε απο τη προσωπική μου
συλλογή)

Για να δικαιώσω τον τίτλο του post θα έλεγα οτι πρόκειται για ένα δικινητήριο αεροσκάφος, χαμηλής πτέρυγας, με ουραίο τρόχο (taildragger). Κατά πάσα πιθανότητα ο τύπος αεροσκάφους στον οποίο είναι βασισμένο αυτό το κατασκεύασμα είναι το θρυλικό Douglas DC-3, η στρατιωτική έκδοση του οποίου αποκαλούταν και DACoTA. Η λέξη αυτή, εξελληνισμένη, αναγράφεται και στις μικρές αντιρίδες των φτερών.

Ο "Ντακότας" απο μια άλλη γωνία. Το μικρό ελικοφόρο δελταπτέρυγο (!) αεροπλάνο στα δεξιά είναι πιο απλής κατασκευής και προστέθηκε απο όσο μπορώ να θυμηθώ, πολύ αργότερα απο τον...βασικό στάρ του κήπου.

Παρ' όλα αυτά, ο δημιουργός του φαίνεται πως είχε τη πρόθεση να προσθέσει άλλο ένα κινητήρα στη μύτη του αεροσκάφους και μάλιστα έχει προσέξει ώστε το πιλοτήριο να βγεί πιο ψηλά και πρός τα πίσω, προφανώς για να εξοικονομήσει το χώρο για τον επιπλέον κινητήρα. Έτσι το αεροπλάνο μοιάζει περισσότερο με ένα άλλο δημοφιλές αεροπλάνο της ίδιας περίπου εποχής, το Junkers Ju-52.

Πιο εντυπωσιακό είναι ίσως το γεγονός οτι αυτή η κατασκευή στέκεται επάνω σε μια τσιμεντένια κολώνα που προφανώς χτίστηκε εκεί επίτηδες σαν βάση, αφού δεν φαίνεται, έτσι μονάχη της καθώς είναι, να περιμένει τον επόμενο όροφο "όταν θα έχουμε λεφτά".

Συνοικία Το Όνειρο...

Όμως κακά τα ψέματα. Πρόκειται για μια βαριά, χοντροκομένη σιδεροκατασκευή, εκτός κλίμακας και με πρόχειρα υλικά. Με ατροφικές πτέρυγες και δυσανάλογη ουρά και κινητήρες...Και αυτό είναι ίσως που του δίνει την όποια αξία του.

Αυτό δεν είναι το μοντέλο ενός αεροπλάνου. Είναι ένα αεροπλάνο, μέσα απο τη μοναδική ματιά του δημιουργού του. Είναι, ένα έργο τέχνης. Λαϊκής τέχνης, Μοντέρνας τέχνης...δεν έχει σημασία. Σημασία έχει οτι ο δημιουργός του, με αυτή την κίνηση, δημιούργησε κάτι που στόλισε (και καθόρισε) μια ολόκληρη γειτονιά και σίγουρα, έκανε κάποιους ανθρώπους να σηκώσουν το κεφάλι τους πρός τον ουρανό.

Το αεροπλάνο αυτό, στέκεται εκεί για πάνω απο 25 χρόνια και έχει σίγουρα δεί και καλύτερες ημέρες. Εγώ το θυμάμαι βαμένο μπέζ, κόκκινο, με διαφορετικές φτερούγες και με τα λαμπιόνια του αναμένα, ειδικά τον Ιούλιο όταν κατηφορίζαμε πρός το παζάρι της Αγίας Παρασκευής που γινόταν (και γίνεται ακόμα) κάθε χρόνο στο περίφημο "Πάρκο Του Λαού", στο τέλος αυτού του δρόμου, στη κατεύθυνση που δείχνει το αεροπλάνο.

Τη τελευταία φορά που επισκεύθηκα τη τοποθεσία, μαζί με τη φωτογραφική μηχανή, ήμουν αποφασισμένος να μάθω περισσότερα. Το σπίτι ήταν σκοτείνο και στα 10-15 λέπτα που έκατσα απ' έξω, τραβώντας μερικές φωτογραφίες, δεν έδειχνε περισσότερα σημάδια ζωής...Έτσι απο οτι μπόρεσα να μάθω απο τους περίοικους...είχα αργήσει.

Το αεροπλάνο το κατασκεύασε ο κύριος Λάζαρος (έτσι το όνομα που φαίνεται στην άτρακτο, αντί αριθμού νηολογίου, είναι του κατασκευαστή του). Η δουλειά του, δεν είχε καμία σχέση με την αεροπορία. Πέθανε πολύ πρόσφατα και μάλλον όχι απο φυσικά αίτια.

Το αεροπλάνο το έφτιαξε "για τη τρέλα του".
top