Τα «μικρά» γλωσσικά μοντέλα, αποτελούν το νέο προϊόν που λανσάρουν οι εταιρείες που ασχολούνται με την τεχνητή νοημοσύνη. Έχοντας ξοδέψει δισεκατομμύρια για την κατασκευή των λεγόμενων μεγάλων γλωσσικών μοντέλων για να τροφοδοτήσουν τα προϊόντα δημιουργικής τεχνητής νοημοσύνης (generative AI), φέρνουν ένα νέο προϊόν για να αυξήσουν τα έσοδά τους.
Όπως αναφέρουν οι Financial Times, η Apple, η Microsoft, η Meta και η Google κυκλοφόρησαν πρόσφατα νέα μοντέλα τεχνητής νοημοσύνης με λιγότερες «παραμέτρους», τον αριθμό δηλαδή των μεταβλητών που χρησιμοποιούνται για την εκπαίδευση ενός συστήματος τεχνητής νοημοσύνης και τη διαμόρφωση των αποτελεσμάτων, τα οποία όμως εξακολουθούν να διαθέτουν ισχυρές δυνατότητες.
Το πλεονέκτημα των μικρών γλωσσικών μοντέλων
Τα μικρά γλωσσικά μοντέλα στοχεύουν να φέρουν περισσότερους εταιρικούς πελάτες και να τους ενθαρρύνουν στην υιοθέτηση της τεχνητής νοημοσύνης, καθώς πολλές εταιρείες έχουν ανησυχίες σχετικά με το κόστος και την υπολογιστική ισχύ που απαιτούνται για την εκτέλεση μεγάλων γλωσσικών μοντέλων, το είδος της τεχνολογίας που στηρίζει δημοφιλή chatbots όπως το ChatGPT της OpenAI. Σε γενικές γραμμές, όσο μεγαλύτερος είναι ο αριθμός των παραμέτρων, τόσο καλύτερη είναι η απόδοση της AI και τόσο πιο πολύπλοκες και διαφοροποιημένες μπορούν να είναι οι εργασίες του.
Το τελευταίο μοντέλο GPT-4 της OpenAI και το Gemini 1.5 Pro της Google, που ανακοινώθηκαν και τα δύο αυτή την εβδομάδα, εκτιμάται ότι έχουν περισσότερες από 1 τρισεκατομμύριο παραμέτρους, ενώ η Meta «εκπαιδεύει» μια έκδοση 400 δισ. παραμέτρων στο μοντέλο Llama ανοιχτού κώδικα.
Εκτός από το γεγονός ότι δυσκολεύονται να πείσουν ορισμένους εταιρικούς πελάτες να πληρώσουν τα μεγάλα ποσά που απαιτούνται για την εκτέλεση προϊόντων δημιουργικής τεχνητής νοημοσύνης, υπάρχουν επίσης ανησυχίες σχετικά με την ευθύνη για τα δεδομένα και τα πνευματικά δικαιώματα που εμποδίζουν την υιοθέτησή τους.
Αυτό έχει οδηγήσει τεχνολογικούς ομίλους όπως η Meta και η Google να προωθήσουν μικρά γλωσσικά μοντέλα με μόλις μερικά δισεκατομμύρια παραμέτρους ως φθηνότερες, ενεργειακά αποδοτικές, προσαρμόσιμες εναλλακτικές λύσεις που απαιτούν λιγότερη ενέργεια για την εκπαίδευση και τη λειτουργίας τους, οι οποίες μπορούν επίσης να προστατεύσουν ευαίσθητα δεδομένα.
Η Google, η Meta, η Microsoft και η γαλλική νεοφυής επιχείρηση Mistral έχουν επίσης κυκλοφορήσει μικρά γλωσσικά μοντέλα που παρουσιάζουν εξελισσόμενες δυνατότητες και μπορούν να επικεντρωθούν καλύτερα σε συγκεκριμένες εφαρμογές.
Μικρά μοντέλα σε μικρές συσκευές
Τα μικρά μοντέλα έχουν τη δυνατότητα να πραγματοποιούν εργασίες τοπικά σε μια συσκευή, αντί να στέλνουν πληροφορίες στο cloud, γεγονός που θα μπορούσε να προσελκύσει πελάτες με ευαισθησία σε θέματα προσωπικών δικαιωμάτων, οι οποίοι θέλουν να διασφαλίσουν ότι οι πληροφορίες διατηρούνται εντός εσωτερικών δικτύων.
Τα μικρότερα μοντέλα επιτρέπουν επίσης την εκτέλεση λειτουργιών τεχνητής νοημοσύνης σε συσκευές όπως τα κινητά τηλέφωνα. Το μοντέλο “Gemini Nano” της Google είναι ενσωματωμένο στο τελευταίο τηλέφωνο Pixel και στο τελευταίο smartphone S24 της Samsung.
Η Apple έχει αφήσει να εννοηθεί ότι αναπτύσσει επίσης μοντέλα τεχνητής νοημοσύνης για να τρέξουν στο iPhone. Τον περασμένο μήνα, ο γίγαντας της Silicon Valley κυκλοφόρησε το μοντέλο OpenELM, ένα μικρό μοντέλο που βασίζεται σε εντολές μέσω κειμένου.
Ο επικεφαλής της OpenAI Σαμ Άλτμαν δήλωσε τον Νοέμβριο ότι η νεοφυής επιχείρηση με έδρα το Σαν Φρανσίσκο προσφέρει σε πελάτες μοντέλα AI διαφορετικού μεγέθους που “εξυπηρετούν ξεχωριστούς σκοπούς” και θα συνεχίσει να κατασκευάζει και να πωλεί αυτές τις επιλογές.
πηγή:ot.gr