Η Google εγκαινιάζει το Gemini, το μεγαλύτερο ολοκληρωμένο μοντέλο AI μέχρι σήμερα
Τον Μάιο του 2023, η Google αποκάλυψε ότι θα έπαιρνε δύο από τις ερευνητικές ομάδες της – Brain Team και DeepMind – και θα τις έβαζε μαζί για να δημιουργήσει μια ενιαία μονάδα με την ονομασία Google DeepMind. Τώρα αυτή η νέα ομάδα έχει αναπτύξει ίσως το πιο ολοκληρωμένο μοντέλο τεχνητής νοημοσύνης επόμενης γενιάς της Google, το Gemini το οποίο το λανσάρει σε τρεις εκδόσεις με τις δύο να διατίθενται από σήμερα.
Σε μια ανάρτηση στο ιστολόγιο, της η Google παρουσίασε επίσημα τη το νέο μοντέλο πολυτροπικής τεχνητής νοημοσύνης της, το Gemini το οποίο σημαίνει ότι μπορεί να γενικεύει και να κατανοεί απρόσκοπτα, να λειτουργεί και να συνδυάζει διαφορετικούς τύπους πληροφοριών, όπως: Κείμενο Εικόνες από την αρχή.
Χαρακτηριστικά αναφέρει:
Μέχρι τώρα, η τυπική προσέγγιση για τη δημιουργία πολυτροπικών μοντέλων περιελάμβανε την εκπαίδευση ξεχωριστών εξαρτημάτων για διαφορετικούς τρόπους και στη συνέχεια τη συρραφή τους για να μιμηθεί κατά προσέγγιση μέρος αυτής της λειτουργικότητας. Αυτά τα μοντέλα μπορεί μερικές φορές να είναι καλά στην εκτέλεση ορισμένων εργασιών, όπως η περιγραφή εικόνων, αλλά δυσκολεύονται με πιο εννοιολογικό και σύνθετο συλλογισμό.
Σχεδιάσαμε το Gemini ώστε να είναι εγγενώς πολυτροπικό, προεκπαιδευμένο από την αρχή σε διαφορετικούς τρόπους. Στη συνέχεια, το βελτιστοποιήσαμε με πρόσθετα πολυτροπικά δεδομένα για να βελτιώσουμε περαιτέρω την αποτελεσματικότητά του. Αυτό βοηθά το Gemini να κατανοεί απρόσκοπτα και να αιτιολογεί όλα τα είδη εισροών από την αρχή, πολύ καλύτερα από τα υπάρχοντα πολυτροπικά μοντέλα — και οι δυνατότητές του είναι αιχμής σε σχεδόν κάθε τομέα
Σύμφωνα με πληροφορίες, το Gemini θα διατίθεται σε τρία διαφορετικά μεγέθη για να λειτουργεί αποτελεσματικά για διαφορετικές ανάγκες. Η μεγαλύτερη και πιο ικανή έκδοση ονομάζεται Gemini Ultra και λέγεται ότι έχει σχεδιαστεί για ιδιαίτερα σύνθετες εργασίες. Κάτω από αυτό είναι το Gemini Pro, το οποίο έχει σχεδιαστεί για να χρησιμοποιείται σε μια σειρά συσκευών. Η τρίτη έκδοση του AI – Gemini Nano – προορίζεται να είναι το πιο αποδοτικό μοντέλο για εργασίες σε κινητές συσκευές ή tablets. Η Google λέει ότι βελτιστοποίησε τρία διαφορετικά μεγέθη για την πρώτη έκδοση του Gemini, γεγονός που θα μπορούσε να σημαίνει ότι στο μέλλον θα μπορούσαν τελικά να έρθουν και άλλα μεγέθη.
Όσον αφορά τις επιδόσεις, ο οργανισμός με έδρα το Mountain View ισχυρίζεται ότι το Gemini Ultra ξεπερνά τα 30 από τα 32 ακαδημαϊκά σημεία αναφοράς για τα τρέχοντα αποτελέσματα της τελευταίας τεχνολογίας που χρησιμοποιούνται για τα LLM. Φέρεται να κερδίζει το GPT-4 του OpenAI σε κάθε κατηγορία εκτός από την κοινή λογική για καθημερινές εργασίες σε σχέση με το κείμενο.
Με αυτές τις βελτιωμένες δυνατότητες, η Google αναγνωρίζει την ανάγκη για περισσότερα μέτρα ασφαλείας. Η εταιρεία λέει ότι προσθέτει νέες προστασίες στην τρέχουσα πολιτική της για τις αρχές της τεχνητής νοημοσύνης. Λέει επίσης ότι έχει “διεξάγει νέα έρευνα σε δυνητικούς τομείς κινδύνου”, έχει εφαρμόσει τεχνικές αντιπολιτευτικών δοκιμών, έχει συνεργαστεί με “μια διαφορετική ομάδα εξωτερικών εμπειρογνωμόνων και συνεργατών” για να εντοπίσει τυφλά σημεία και έχει “κατασκευάσει ειδικούς ταξινομητές ασφαλείας” για να φιλτράρει τη βία και τα αρνητικά στερεότυπα.
Όσον αφορά το πότε θα είναι διαθέσιμο το Gemini 1.0, η Google λέει ότι επεκτείνει την τεχνητή νοημοσύνη τώρα σε διάφορα προϊόντα ξεκινώντας από σήμερα. Ένα από αυτά τα προϊόντα που παίρνουν το LLM σήμερα είναι το Bard, το οποίο φέρεται να χρησιμοποιεί μια βελτιωμένη έκδοση του Gemini Pro. Το Pixel 8 Pro αποκτά επίσης την AI σήμερα – Gemini Nano – και θα τροφοδοτεί το Summarize στην εφαρμογή Recorder και το Smart Reply στο Gboard για το WhatsApp. Και το Search Generative Experience της Google βελτιώνεται επίσης με το Gemini, το οποίο φέρεται να μειώνει την καθυστέρηση κατά 40% στα αγγλικά στις ΗΠΑ.
Το Gemini Ultra, από την άλλη πλευρά, δεν θα κυκλοφορήσει σήμερα, καθώς λέγεται ότι υποβάλλεται σε “εκτεταμένους ελέγχους εμπιστοσύνης και ασφάλειας”. Ωστόσο, η Google αναφέρει ότι θα διαθέσει το Ultra για πρώιμο πειραματισμό σε επιλεγμένους πελάτες, προγραμματιστές και συνεργάτες στις αρχές του επόμενου έτους.