04
Sun, May
331 New Articles

TechCrunch - Ο CEO της Anthropic θέλει να ανοίξει το «μαύρο κουτί» των μοντέλων ΑΙ μέχρι το 2027

TechCrunch - Ο CEO της Anthropic θέλει να ανοίξει το «μαύρο κουτί» των μοντέλων ΑΙ μέχρι το 2027

ΤΕΧΝΟΛΟΓΙΑ
TechCrunch - Ο CEO της Anthropic θέλει να ανοίξει το «μαύρο κουτί» των μοντέλων ΑΙ μέχρι το 2027

Ο Διευθύνων Σύμβουλος της Anthropic, Dario Amodei, δημοσίευσε την Πέμπτη ένα άρθρο που τονίζει πόσο λίγα κατανοούν οι ερευνητές για την εσωτερική λειτουργία των κορυφαίων μοντέλων ΑΙ στον κόσμο, σύμφωνα με το TechCrunch. Για να το αντιμετωπίσει αυτό, ο Amodei θέτει έναν φιλόδοξο στόχο για την Anthropic: να είναι σε θέση να ανιχνεύει αξιόπιστα τα περισσότερα προβλήματα των μοντέλων ΑΙ μέχρι το 2027.

Ο Amodei αναγνωρίζει την πρόκληση που βρίσκεται μπροστά. Στο άρθρο του με τίτλο «Η Επιτακτικότητα της Ερμηνευσιμότητας», ο Διευθύνων Σύμβουλος αναφέρει ότι η Anthropic έχει κάνει πρώιμες ανακαλύψεις στον τομέα της ανίχνευσης του τρόπου με τον οποίο τα μοντέλα φτάνουν στις απαντήσεις τους, αλλά τονίζει ότι απαιτείται πολύ περισσότερη έρευνα για να αποκωδικοποιηθούν αυτά τα συστήματα καθώς γίνονται πιο ισχυρά.

«Είμαι πολύ ανήσυχος για την ανάπτυξη αυτών των συστημάτων χωρίς να έχουμε καλύτερη κατανόηση της ερμηνευσιμότητάς τους», γράφει ο Amodei στο άρθρο του. «Αυτά τα συστήματα θα είναι απολύτως κεντρικά στην οικονομία, την τεχνολογία και την εθνική ασφάλεια, και θα έχουν τόση αυτονομία που θεωρώ απολύτως απαράδεκτο για την ανθρωπότητα να είναι εντελώς αδαείς για το πώς λειτουργούν».

Η Anthropic είναι μία από τις πρωτοπόρες εταιρείες στην ερμηνευσιμότητα μηχανισμών, έναν τομέα που αποσκοπεί στο να ανοίξει το "μαύρο κουτί" των μοντέλων ΑΙ και να κατανοήσει γιατί παίρνουν τις αποφάσεις που παίρνουν. Παρά τις ραγδαίες βελτιώσεις στην απόδοση των μοντέλων ΑΙ της τεχνολογικής βιομηχανίας, εξακολουθούμε να έχουμε σχετικά μικρή ιδέα για το πώς αυτά τα συστήματα καταλήγουν σε αποφάσεις.

Για παράδειγμα, η OpenAI κυκλοφόρησε πρόσφατα νέα μοντέλα ΑΙ λογικής, τα o3 και o4-mini, τα οποία αποδίδουν καλύτερα σε ορισμένα καθήκοντα, αλλά παράλληλα κάνουν περισσότερες ψευδαισθήσεις σε σχέση με τα άλλα μοντέλα της. Η εταιρεία δεν γνωρίζει γιατί συμβαίνει αυτό.

«Όταν ένα γενετικό σύστημα ΑΙ κάνει κάτι, όπως να συνοψίσει ένα οικονομικό έγγραφο, δεν έχουμε ιδέα, σε συγκεκριμένο ή ακριβή επίπεδο, γιατί παίρνει τις επιλογές του - γιατί επιλέγει κάποιες λέξεις αντί για άλλες ή γιατί κάνει περιστασιακά ένα λάθος, παρόλο που γενικά είναι ακριβές», γράφει ο Amodei στο άρθρο του.

Στο άρθρο του, ο Amodei αναφέρει ότι ο συνιδρυτής της Anthropic, Chris Olah, λέει ότι τα μοντέλα ΑΙ «αναπτύσσονται περισσότερο παρά κατασκευάζονται». Με άλλα λόγια, οι ερευνητές ΑΙ έχουν βρει τρόπους να βελτιώσουν την ευφυΐα των μοντέλων ΑΙ, αλλά δε γνωρίζουν ακριβώς το γιατί.

Στο άρθρο του, ο Amodei αναφέρει ότι θα μπορούσε να είναι επικίνδυνο να φτάσουμε στην AGI (Γενική Τεχνητή Νοημοσύνη) -ή όπως την αποκαλεί ο ίδιος, «μια χώρα γεμάτων ιδιοφυΐες σε ένα κέντρο δεδομένων»- χωρίς να κατανοούμε πώς λειτουργούν αυτά τα μοντέλα. Σε προηγούμενο άρθρο, ο Amodei είχε δηλώσει ότι η τεχνολογική βιομηχανία θα μπορούσε να φτάσει σε αυτό το ορόσημο το 2026 ή το 2027, αλλά πιστεύει ότι βρισκόμαστε πολύ πιο μακριά από το να κατανοήσουμε πλήρως αυτά τα μοντέλα ΑΙ.

Σε βάθος χρόνου, ο Amodei αναφέρει ότι η Anthropic θα ήθελε να διεξάγει, ουσιαστικά, «ακτινογραφήσεις» ή «Μαγνητικές Τομογραφίες» των μοντέλων ΑΙ τελευταίας τεχνολογίας. Αυτές οι εξετάσεις θα βοηθήσουν στην αναγνώριση μιας σειράς θεμάτων στα μοντέλα ΑΙ, όπως οι τάσεις τους να λένε ψέματα ή να επιθυμούν εξουσία, ή άλλες αδυναμίες, προσθέτει ο ίδιος. Αυτό θα μπορούσε να πάρει από 5 έως 10 χρόνια για να επιτευχθεί, αλλά αυτές οι μέθοδοι θα είναι απαραίτητες για να ελεγχθούν και να αναπτυχθούν τα μελλοντικά μοντέλα ΑΙ της Anthropic, προσθέτει.

Η Anthropic έχει κάνει κάποιες ερευνητικές ανακαλύψεις που της επέτρεψαν να κατανοήσει καλύτερα τον τρόπο με τον οποίο λειτουργούν τα μοντέλα ΑΙ της. Για παράδειγμα, η εταιρεία ανακάλυψε πρόσφατα τρόπους να ανιχνεύει τα μονοπάτια σκέψης ενός μοντέλου ΑΙ μέσω αυτό που η εταιρεία αποκαλεί «κυκλώματα». Η Anthropic αναγνώρισε ένα κύκλωμα που βοηθά τα μοντέλα ΑΙ να κατανοήσουν ποιες αμερικανικές πόλεις βρίσκονται σε ποιες πολιτείες των ΗΠΑ. Η εταιρεία έχει βρει μόνο μερικά από αυτά τα κυκλώματα, αλλά εκτιμά ότι υπάρχουν εκατομμύρια μέσα στα μοντέλα ΑΙ.

Η Anthropic επενδύει στην έρευνα της ερμηνευσιμότητας και πρόσφατα πραγματοποίησε την πρώτη της επένδυση σε μια νεοφυή επιχείρηση που εργάζεται πάνω στην ερμηνευσιμότητα. Ενώ η ερμηνευσιμότητα θεωρείται σήμερα σε μεγάλο βαθμό ως τομέας έρευνας ασφάλειας, ο Amodei σημειώνει ότι, τελικά, η εξήγηση του τρόπου με τον οποίο τα μοντέλα ΑΙ καταλήγουν στις απαντήσεις τους θα μπορούσε να προσφέρει εμπορικό πλεονέκτημα.

Στο άρθρο του, ο Amodei κάλεσε την OpenAI και την Google DeepMind να εντείνουν τις ερευνητικές τους προσπάθειες στον τομέα. Πέρα από τη φιλική παρότρυνση, ο Διευθύνων Σύμβουλος της Anthropic ζήτησε από τις κυβερνήσεις να επιβάλουν «ήπιους» κανονισμούς για να ενθαρρύνουν την έρευνα στην ερμηνευσιμότητα, όπως απαιτήσεις για τις εταιρείες να αποκαλύπτουν τις πρακτικές ασφάλειας και προστασίας τους. Στο άρθρο του, ο Amodei αναφέρει επίσης ότι οι ΗΠΑ πρέπει να επιβάλουν περιορισμούς εξαγωγών σε τσιπ προς την Κίνα, προκειμένου να περιορίσουν την πιθανότητα μιας ανεξέλεγκτης παγκόσμιας κούρσας στην Τεχνητή Νοημοσύνη.

Η Anthropic ξεχωρίζει πάντα από την OpenAI και την Google για την εστίασή της στην ασφάλεια. Ενώ άλλες τεχνολογικές εταιρείες αντιτάχθηκαν στο αμφιλεγόμενο νομοσχέδιο ασφάλειας ΑΙ της Καλιφόρνια, SB 1047, η Anthropic εξέδωσε ήπια υποστήριξη και προτάσεις για το νομοσχέδιο, το οποίο θα καθόριζε πρότυπα αναφοράς ασφάλειας για τους προγραμματιστές μοντέλων ΑΙ πρώτης γραμμής.

Σε αυτή την περίπτωση, η Anthropic φαίνεται να προωθεί μια προσπάθεια σε επίπεδο βιομηχανίας για μια καλύτερη κατανόηση των μοντέλων ΑΙ, και όχι μόνο για την αύξηση των δυνατοτήτων τους.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Παύλος Μαρινάκης: "Αυτό που μπορώ να πω με σιγουριά είναι ότι στη ΔΕΘ θα δούμε μειώσεις φόρων"

Πολιτικη

Παύλος Μαρινάκης: "Αυτό που μπορώ να πω με σιγουριά είναι ότι στη ΔΕΘ θα δούμε μειώσεις φόρων"

Νίκος Ανδρουλάκης: "Στην κοινωνία θα κερδίσουμε τον δήθεν μονόδρομο που θέλουν να οικοδομήσουν τα συμφέροντα Μητσοτάκη"

Πολιτικη

Νίκος Ανδρουλάκης: "Στην κοινωνία θα κερδίσουμε τον δήθεν μονόδρομο που θέλουν να οικοδομήσουν τα συμφέροντα Μητσοτάκη"

Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό - Παπαστεργίου: "H νέα ρύθμιση θα εξαλείψει την ταλαιπωρία των πολιτών"

Πολιτικη

Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό - Παπαστεργίου: "H νέα ρύθμιση θα εξαλείψει την ταλαιπωρία των πολιτών"

Παπαστεργίου: Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό

ΟΙΚΟΝΟΜΙΑ

Παπαστεργίου: Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό

Η πραγματικότητα είναι η κατοχή, είναι γνωστή η θέση του Ερντογάν, λέει ο Χριστοδουλίδης

ΟΙΚΟΝΟΜΙΑ

Η πραγματικότητα είναι η κατοχή, είναι γνωστή η θέση του Ερντογάν, λέει ο Χριστοδουλίδης

Διευκρινίσεις του υπουργείου Τουρισμού για τα τροχόσπιτα: Στάθμευση μόνο σε οργανωμένα κάμπινγκ

ΟΙΚΟΝΟΜΙΑ

Διευκρινίσεις του υπουργείου Τουρισμού για τα τροχόσπιτα: Στάθμευση μόνο σε οργανωμένα κάμπινγκ

Τέλος εποχής για τον Γουόρεν Μπάφετ: Παραιτείται από CEO της Berkshire

ΕΠΙΧEIΡΗΣΕΙΣ

Τέλος εποχής για τον Γουόρεν Μπάφετ: Παραιτείται από CEO της Berkshire

ΝΔ περί αμφισβήτησης γνησιότητας των βίντεο της τραγωδίας των Τεμπών: «Ο ΣΥΡΙΖΑ το μόνο που καταφέρνει είναι να αυτογελοιοποιείται»

ΕΠΙΧEIΡΗΣΕΙΣ

ΝΔ περί αμφισβήτησης γνησιότητας των βίντεο της τραγωδίας των Τεμπών: «Ο ΣΥΡΙΖΑ το μόνο που καταφέρνει είναι να αυτογελοιοποιείται»

Κόντρα Γεωργιάδη- Ακρίτα: «Ξέπλυμα της παρακρατικής Ομάδας Αλήθειας η φωτογραφία Άδωνι» – «Ραντεβού στο δικαστήριο»

ΕΠΙΧEIΡΗΣΕΙΣ

Κόντρα Γεωργιάδη- Ακρίτα: «Ξέπλυμα της παρακρατικής Ομάδας Αλήθειας η φωτογραφία Άδωνι» – «Ραντεβού στο δικαστήριο»

Σεισμός τώρα στην Θεσπρωτία με επίκεντρο την Λεπτοκαρυά

ΚΟΙΝΩΝΙΚΑ

Σεισμός τώρα στην Θεσπρωτία με επίκεντρο την Λεπτοκαρυά

Η Δέσποινα Βανδή τραγούδησε μαζί με την κόρη της on stage στο μαγαζί που εμφανίζεται (Βίντεο)

ΚΟΙΝΩΝΙΚΑ

Η Δέσποινα Βανδή τραγούδησε μαζί με την κόρη της on stage στο μαγαζί που εμφανίζεται (Βίντεο)

Θεσσαλονίκη: Γυναίκα επιτέθηκε με μαχαίρι στο σύντροφό της - Σε σοβαρή κατάσταση το θύμα

ΚΟΙΝΩΝΙΚΑ

Θεσσαλονίκη: Γυναίκα επιτέθηκε με μαχαίρι στο σύντροφό της - Σε σοβαρή κατάσταση το θύμα

Χριστοδουλίδης: Yπάρχει μια παράνομη κατοχή στην Κύπρο για 50 χρόνια

Διεθνη

Χριστοδουλίδης: Yπάρχει μια παράνομη κατοχή στην Κύπρο για 50 χρόνια

Σεϊνμπάουμ: Απέρριψε προσφορά του Τραμπ να στείλει αμερικανικό στρατό στο Μεξικό

Διεθνη

Σεϊνμπάουμ: Απέρριψε προσφορά του Τραμπ να στείλει αμερικανικό στρατό στο Μεξικό

Αυστραλία: Το κερδισμένο στοίχημα του Αλμπανέζε και ο παράγοντας Τραμπ

Διεθνη

Αυστραλία: Το κερδισμένο στοίχημα του Αλμπανέζε και ο παράγοντας Τραμπ

ΟΠΕΚ+: Νέα αύξηση της παραγωγής τον Ιούνιο κατά 411.000 βαρέλια ημερησίως

Αγορες Χρημα

ΟΠΕΚ+: Νέα αύξηση της παραγωγής τον Ιούνιο κατά 411.000 βαρέλια ημερησίως

Wall Street: Άλμα 600 μονάδων για τον Dow, άνοδος 1,5% για τον S&P 500

Αγορες Χρημα

Wall Street: Άλμα 600 μονάδων για τον Dow, άνοδος 1,5% για τον S&P 500

Χρυσός: Σταθεροποιούνται οι τιμές, απώλειες στην εβδομάδα

Αγορες Χρημα

Χρυσός: Σταθεροποιούνται οι τιμές, απώλειες στην εβδομάδα

Eurovision: Οι 5 καλύτερες και οι 5 χειρότερες συμμετοχές της Ελλάδας

Καθημερινα

Eurovision: Οι 5 καλύτερες και οι 5 χειρότερες συμμετοχές της Ελλάδας

Φάκελος στεγαστική κρίηση: Αναζητώντας δικαιοσύνη - Πώς θα αναχαιτιστεί η κρίση

Καθημερινα

Φάκελος στεγαστική κρίηση: Αναζητώντας δικαιοσύνη - Πώς θα αναχαιτιστεί η κρίση

Ισραήλ: Ο στρατός επιστρατεύει δεκάδες χιλιάδες εφέδρους στην προετοιμασία επέκτασης της επίθεσής του στη Γάζα

Καθημερινα

Ισραήλ: Ο στρατός επιστρατεύει δεκάδες χιλιάδες εφέδρους στην προετοιμασία επέκτασης της επίθεσής του στη Γάζα