AI εντοπίζει ακριβώς την θέση σας κοιτάζοντας απλά στο Google Street View
Ένα μοντέλο τεχνητής νοημοσύνης που αναπτύχθηκε από μεταπτυχιακούς φοιτητές του Στάνφορντ, μπορεί να προσδιορίσει -με εντυπωσιακή ακρίβεια- μια συγκεκριμένη τοποθεσία απλά κοιτάζοντας το Google Street View.
Σίγουρα θα σας έχουνε πει ποτέ να μη δημοσιεύετε προσωπικές πληροφορίες, όπως αριθμούς πινακίδων κυκλοφορίας, ονόματα οδών ή αριθμούς σπιτιών στα μέσα κοινωνικής δικτύωσης.Ε λοιπόν όλα αυτά πάνε περίπατο γιατί μοντέλο Generative AI μπορεί να σας εντοπίσει μέσα από το φόντο μίας φωτογραφίας σας;
Τώρα, μεταπτυχιακοί φοιτητές του Πανεπιστημίου του Στάνφορντ ανέπτυξαν μια εφαρμογή που μπορεί να ανιχνεύσει την τοποθεσία σας από μια άποψη του δρόμου ή ακόμη και από μια απλή εικόνα, Το έργο, που ονομάζεται Predicting Image Geolocations (PIGEON), μπορεί – στις περισσότερες περιπτώσεις – να προσδιορίσει με ακρίβεια μια συγκεκριμένη τοποθεσία απλά κοιτάζοντας το Google Street View της τοποθεσίας.
Το PIGEON μπορεί να προβλέψει την την τοποθεσία της φωτογραφίας με ακρίβεια 92% παρακαλώ, σύμφωνα με το preprint paper. Για να καταλάβετε πόσο εντυπωσιακό είναι αυτό, το PIGEON κατατάσσεται μέσα στο κορυφαίο 0,01% των παικτών του GeoGuessr, το παιχνίδι στο οποίο οι χρήστες μαντεύουν την τοποθεσία μιας φωτογραφίας που έχει ληφθεί από ένα Google Street View της τοποθεσίας.
Πώς ακριβώς λειτουργεί το PIGEON;
Οι φοιτητές αξιοποίησαν το CLIP, ένα νευρωνικό δίκτυο που αναπτύχθηκε από την OpenAI και μπορεί να συνδέσει κείμενο και εικόνες εκπαιδεύοντάς το με τα ονόματα των οπτικών κατηγοριών που πρέπει να αναγνωριστούν,
Στη συνέχεια, εμπνευσμένο από το GeoGuessr, το PIGEON εκπαιδεύτηκε σε ένα σύνολο δεδομένων με 100.000 αρχικές, τυχαία επιλεγμένες τοποθεσίες από το GeoGuessr και ένα σύνολο λήψης τεσσάρων εικόνων για να καλύψει ένα ολόκληρο “πανόραμα” σε μια δεδομένη τοποθεσία, δηλαδή συνολικά 400.000 εικόνες,
Σε σύγκριση με τον αριθμό των εικόνων στις οποίες εκπαιδεύονται άλλα μοντέλα τεχνητής νοημοσύνης, το PIGEON ωχριά μπροστά τους αφού ενδεικτικά, το δημοφιλές μοντέλο δημιουργίας εικόνων του OpenAI, DALL-E 2, εκπαιδεύεται σε εκατοντάδες εκατομμύρια εικόνες,
Οι φοιτητές εργάστηκαν επίσης σε ένα ξεχωριστό μοντέλο με την ονομασία PIGEOTTO, το οποίο εκπαιδεύτηκε σε πάνω από τέσσερα εκατομμύρια φωτογραφίες που προέρχονταν από το Flickr και τη Wikipedia για τον εντοπισμό μιας τοποθεσίας από μία μόνο εικόνα ως είσοδο,
Οι επιδόσεις του PIGEOTTO πέτυχαν εντυπωσιακά αποτελέσματα σε δείκτες αναφοράς γεωεντοπισμού εικόνων, ξεπερνώντας τα προηγούμενα αποτελέσματα της τελευταίας τεχνολογίας κατά 7,7% στην ακρίβεια πόλεων και κατά 29,8% στην ακρίβεια χωρών, σύμφωνα με το έγγραφο. ,
Το έγγραφο ωστόσο και τις αρνητικές επιπτώσεις καθώς μπορεί να γίνεται κατάφωρη παραβίαση της ιδιωτικής ζωής. Αυτό είχε ως αποτέλεσμα, οι φοιτητές να μην δημοσιοποιήσουν περαιτέρω στοιχεία μοντέλου παρά να δώσουν τον κώδικα μόνο για ακαδημαϊκή επικύρωση, σύμφωνα με την εφημερίδα.