Μια εταιρεία ρομποτικής κυκλοφόρησε ένα βίντεο που υποτίθεται ότι δείχνει ένα ανθρωποειδές ρομπότ να φτιάχνει ένα φλιτζάνι καφέ, έχοντας πρώτα δει ανθρώπους να το κάνουν, ενώ διορθώνει τα λάθη του σε πραγματικό χρόνο.
Στο προωθητικό υλικό, το κορυφαίο μοντέλο της Figure.ai, που ονομάζεται “Figure 01”, παίρνει μια κάψουλα καφέ, την βάζει σε μια μηχανή καφέ, κλείνει το καπάκι και ανάβει τη μηχανή.
Η Figure έχει υπογράψει μια εμπορική συμφωνία με τη BMW, στο πλαίσιο της οποίας θα παρέχει τα ανθρωποειδή ρομπότ της στην παραγωγή αυτοκινήτων.
Επί του παρόντος, η ρομποτική που τροφοδοτείται από τεχνητή νοημοσύνη (AI) είναι ειδικού σκοπού, κάτι που σημαίνει ότι αυτά τα μηχανήματα κάνουν ένα πράγμα καλά αντί να κάνουν τα πάντα επαρκώς. Ξεκινούν με μια προγραμματισμένη βασική γραμμή κανόνων και ένα σύνολο δεδομένων που χρησιμοποιείται για αυτοδιδασκαλία. Ωστόσο, η Figure.ai ισχυρίζεται ότι το Figure 01 έμαθε τη διαδικασία, παρακολουθώντας μόνο πλάνα διάρκειας 10 ωρών.
Για να φτάσει ένα ρομπότ να φτιάχνει καφέ ή να κουρεύει το γκαζόν, θα σήμαινε ότι θα υπήρχε ενσωμάτωση της τεχνογνωσίας σε πολλούς τομείς. Όμως, είναι πολύ δύσκολο να προγραμματιστούν κατά αυτόν τον τρόπο. Θα πρέπει να προβλεφθούν και να κωδικοποιηθούν στο λογισμικό του κανόνες για κάθε ενδεχόμενο. Για παράδειγμα, συγκεκριμένες οδηγίες για το τι πρέπει να κάνει το ρομπότ όταν φτάσει στο τέλος του γκαζόν. Επομένως, η απόκτηση τεχνογνωσίας σε πολλούς τομείς μόνο με την παρακολούθηση εικόνων θα σηματοδοτούσε ένα σημαντικό άλμα.
Το πρώτο κομμάτι του παζλ είναι ότι το Figure 01 πρέπει να δει αυτό που υποτίθεται ότι θα επαναλαμβάνει. «Η οπτική επεξεργασία πληροφοριών του επιτρέπει να αναγνωρίζει σημαντικά βήματα και λεπτομέρειες στη διαδικασία», δήλωσε στο Live Science ο Max Maybury, επιχειρηματίας AI και συνιδιοκτήτης του AI Product Reviews.
Το ρομπότ θα πρέπει να λάβει δεδομένα βίντεο και να αναπτύξει ένα εσωτερικό μοντέλο πρόβλεψης των φυσικών ενεργειών και της σειράς αυτών των ενεργειών, δήλωσε στο Live Science ο Christoph Cemper, Διευθύνων Σύμβουλος της AIPRM, ενός ιστότοπου που σχεδιάζει prompts για εισαγωγή σε συστήματα τεχνητής νοημοσύνης, όπως το ChatGPT.
Όπως εξήγησε, για να καταλάβει ένα ρομπότ πώς να εκτελέσει μια εργασία, πρέπει πρώτα να κατανοήσει τι συμβαίνει. Μόλις το καταλάβει, θα πρέπει να μεταφράσει αυτό που βλέπει, και να σχεδιάσει έναν τρόπο για να εκτελέσει την εργασία, δηλαδή να δημιουργήσει ένα πρόγραμμα που θα καθορίζει πώς να κινεί τα άκρα και τις λαβές του για να κάνει τις ίδιες κινήσεις, πρόσθεσε.
Έπειτα, υπάρχει η αρχιτεκτονική των νευρωνικών δικτύων, είπε η Clare Walsh, εμπειρογνώμονας ανάλυσης δεδομένων και τεχνητής νοημοσύνης στο Ινστιτούτο Analytics στο Ηνωμένο Βασίλειο, Πρόκειται για ένα είδος μοντέλου μηχανικής μάθησης εμπνευσμένο από τον τρόπο λειτουργίας του εγκεφάλου. Μεγάλος αριθμός διασυνδεδεμένων μεμονωμένων νευρώνων συνδέονται για να δημιουργήσουν ένα σήμα. Εάν επιτευχθεί το επιθυμητό αποτέλεσμα, όταν τα σήματα οδηγούν σε μια ενέργεια (όπως η προέκταση ενός βραχίονα ή το κλείσιμο μίας λαβής), η ανατροφοδότηση ενισχύει τις νευρικές συνδέσεις που το πέτυχαν, ενσωματώνοντάς το περαιτέρω σε «γνωστές» διαδικασίες.
«Πριν από το 2016, η αναγνώριση αντικειμένων, όπως η διάκριση μεταξύ γατών και σκύλων στις φωτογραφίες, θα είχε ποσοστά επιτυχίας περίπου 50%,» είπε ο Walsh στο Live Science. «Μόλις τα νευρωνικά δίκτυα βελτιώθηκαν και λειτουργούσαν, τα αποτελέσματα αυξήθηκαν στο 80 με 90%, σχεδόν από τη μια μέρα στην άλλη. Η εκπαίδευση μέσω παρατήρησης με μια αξιόπιστη μέθοδο εκμάθησης βελτιώθηκε πάρα πολύ».
Για τον Walsh, υπάρχει μια ομοιότητα μεταξύ του Figure 01 και των αυτόνομων οχημάτων, που κατέστη δυνατή χρησιμοποιώντας μεθόδους εκπαίδευσης που βασίζονται σε πιθανότητες και όχι με κανόνες. Ο ίδιος σημείωσε ότι η αυτοδιδασκαλία μπορεί να δημιουργήσει δεδομένα αρκετά γρήγορα για να λειτουργήσει σε πολύπλοκα περιβάλλοντα.
Γιατί η αυτοδιόρθωση είναι τόσο σημαντική για το ρομπότ
Παρότι για τους περισσότερους ανθρώπους είναι εύκολο να φτιάξουν καφέ, η γνώση της κινητικής λειτουργίας, του ακριβή χειρισμού και της σειράς των γεγονότων είναι εξαιρετικά περίπλοκη διαδικασία για να την μάθει και να την εκτελέσει μια μηχανή. Αυτό καθιστά την ικανότητα αυτοδιόρθωσης σφαλμάτων πρωταρχικής σημασίας, ειδικά αν το Figure 01 ασχολείται από την παρασκευή καφέ έως την ανύψωση βαρών κοντά σε ανθρώπους ή την εκτέλεση επιχειρήσεων διάσωσης.
«Η οπτική οξύτητα του ρομπότ ξεπερνά το να βλέπει κανείς τι συμβαίνει στη διαδικασία παρασκευής καφέ», είπε ο Maybury. «Δεν το παρατηρεί απλώς, αλλά αναλύει τη διαδικασία για να διασφαλίσει ότι όλα είναι όσο το δυνατόν πιο ακριβή».
Αυτό σημαίνει ότι το ρομπότ ξέρει να μην γεμίζει υπερβολικά το φλιτζάνι και γνωρίζει πώς να βάζει σωστά την κάψουλα. Εάν δει οποιαδήποτε απόκλιση από τη συμπεριφορά που έχει μάθει ή τα αναμενόμενα αποτελέσματα, το ερμηνεύει ως λάθος και ρυθμίζει τις ενέργειές του μέχρι να φτάσει στο επιθυμητό αποτέλεσμα. Αυτό γίνεται μέσω της ενισχυτικής μάθησης, στην οποία η γνώση για τον επιθυμητό στόχο αναπτύσσεται μέσω της διαδικασίας δοκιμής και σφάλματος στην πλοήγηση σε ένα αβέβαιο περιβάλλον.
Ο Walsh πρόσθεσε ότι τα σωστά δεδομένα εκπαίδευσης σημαίνουν ότι οι ανθρώπινες κινήσεις του ρομπότ θα μπορούσαν να «εξελιχθούν και να διαφοροποιηθούν» γρήγορα. «Ο αριθμός των κινήσεων είναι εντυπωσιακός και η ακρίβεια και η ικανότητα αυτοδιόρθωσης σημαίνουν ότι θα μπορούσε να σηματοδοτήσει μελλοντικές εξελίξεις στον τομέα», είπε.
Ωστόσο η Mona Kirstein, εμπειρογνώμονας τεχνητής νοημοσύνης με διδακτορικό στην επεξεργασία φυσικής γλώσσας, προειδοποίησε ότι το Figure 01 αποτελεί ένα εξαιρετικό πρώτο βήμα και όχι ένα προϊόν έτοιμο για αγορά.
«Για να επιτευχθεί ευελιξία σε ανθρώπινο επίπεδο με νέα περιβάλλοντα πέρα από μία στενά καθορισμένη εργασία, πρέπει να αντιμετωπιστούν προβλήματα όπως οι παραλλαγές στο περιβάλλον», είπε η Kirstein στο Live Science.
Συμπερασματικά, το ρομπότ αυτό είναι ένα πρώτο βήμα για την ανάπτυξη γενικής νοημοσύνης ανθρωποειδών ρομπότ, αλλά απαιτούνται πολλές ακόμη βελτιώσεις για να επιτευχθούν τα επίπεδα νοημοσύνης που συναντάμε στον ανθρώπινο νου.
Πηγή: enikos.gr