TechCrunch - Ο CEO της Anthropic θέλει να ανοίξει το «μαύρο κουτί» των μοντέλων ΑΙ μέχρι το 2027

TechCrunch - Ο CEO της Anthropic θέλει να ανοίξει το «μαύρο κουτί» των μοντέλων ΑΙ μέχρι το 2027

Ο Διευθύνων Σύμβουλος της Anthropic, Dario Amodei, δημοσίευσε την Πέμπτη ένα άρθρο που τονίζει πόσο λίγα κατανοούν οι ερευνητές για την εσωτερική λειτουργία των κορυφαίων μοντέλων ΑΙ στον κόσμο, σύμφωνα με το TechCrunch. Για να το αντιμετωπίσει αυτό, ο Amodei θέτει έναν φιλόδοξο στόχο για την Anthropic: να είναι σε θέση να ανιχνεύει αξιόπιστα τα περισσότερα προβλήματα των μοντέλων ΑΙ μέχρι το 2027.

Ο Amodei αναγνωρίζει την πρόκληση που βρίσκεται μπροστά. Στο άρθρο του με τίτλο «Η Επιτακτικότητα της Ερμηνευσιμότητας», ο Διευθύνων Σύμβουλος αναφέρει ότι η Anthropic έχει κάνει πρώιμες ανακαλύψεις στον τομέα της ανίχνευσης του τρόπου με τον οποίο τα μοντέλα φτάνουν στις απαντήσεις τους, αλλά τονίζει ότι απαιτείται πολύ περισσότερη έρευνα για να αποκωδικοποιηθούν αυτά τα συστήματα καθώς γίνονται πιο ισχυρά.

«Είμαι πολύ ανήσυχος για την ανάπτυξη αυτών των συστημάτων χωρίς να έχουμε καλύτερη κατανόηση της ερμηνευσιμότητάς τους», γράφει ο Amodei στο άρθρο του. «Αυτά τα συστήματα θα είναι απολύτως κεντρικά στην οικονομία, την τεχνολογία και την εθνική ασφάλεια, και θα έχουν τόση αυτονομία που θεωρώ απολύτως απαράδεκτο για την ανθρωπότητα να είναι εντελώς αδαείς για το πώς λειτουργούν».

Η Anthropic είναι μία από τις πρωτοπόρες εταιρείες στην ερμηνευσιμότητα μηχανισμών, έναν τομέα που αποσκοπεί στο να ανοίξει το "μαύρο κουτί" των μοντέλων ΑΙ και να κατανοήσει γιατί παίρνουν τις αποφάσεις που παίρνουν. Παρά τις ραγδαίες βελτιώσεις στην απόδοση των μοντέλων ΑΙ της τεχνολογικής βιομηχανίας, εξακολουθούμε να έχουμε σχετικά μικρή ιδέα για το πώς αυτά τα συστήματα καταλήγουν σε αποφάσεις.

Για παράδειγμα, η OpenAI κυκλοφόρησε πρόσφατα νέα μοντέλα ΑΙ λογικής, τα o3 και o4-mini, τα οποία αποδίδουν καλύτερα σε ορισμένα καθήκοντα, αλλά παράλληλα κάνουν περισσότερες ψευδαισθήσεις σε σχέση με τα άλλα μοντέλα της. Η εταιρεία δεν γνωρίζει γιατί συμβαίνει αυτό.

«Όταν ένα γενετικό σύστημα ΑΙ κάνει κάτι, όπως να συνοψίσει ένα οικονομικό έγγραφο, δεν έχουμε ιδέα, σε συγκεκριμένο ή ακριβή επίπεδο, γιατί παίρνει τις επιλογές του - γιατί επιλέγει κάποιες λέξεις αντί για άλλες ή γιατί κάνει περιστασιακά ένα λάθος, παρόλο που γενικά είναι ακριβές», γράφει ο Amodei στο άρθρο του.

Στο άρθρο του, ο Amodei αναφέρει ότι ο συνιδρυτής της Anthropic, Chris Olah, λέει ότι τα μοντέλα ΑΙ «αναπτύσσονται περισσότερο παρά κατασκευάζονται». Με άλλα λόγια, οι ερευνητές ΑΙ έχουν βρει τρόπους να βελτιώσουν την ευφυΐα των μοντέλων ΑΙ, αλλά δε γνωρίζουν ακριβώς το γιατί.

Στο άρθρο του, ο Amodei αναφέρει ότι θα μπορούσε να είναι επικίνδυνο να φτάσουμε στην AGI (Γενική Τεχνητή Νοημοσύνη) -ή όπως την αποκαλεί ο ίδιος, «μια χώρα γεμάτων ιδιοφυΐες σε ένα κέντρο δεδομένων»- χωρίς να κατανοούμε πώς λειτουργούν αυτά τα μοντέλα. Σε προηγούμενο άρθρο, ο Amodei είχε δηλώσει ότι η τεχνολογική βιομηχανία θα μπορούσε να φτάσει σε αυτό το ορόσημο το 2026 ή το 2027, αλλά πιστεύει ότι βρισκόμαστε πολύ πιο μακριά από το να κατανοήσουμε πλήρως αυτά τα μοντέλα ΑΙ.

Σε βάθος χρόνου, ο Amodei αναφέρει ότι η Anthropic θα ήθελε να διεξάγει, ουσιαστικά, «ακτινογραφήσεις» ή «Μαγνητικές Τομογραφίες» των μοντέλων ΑΙ τελευταίας τεχνολογίας. Αυτές οι εξετάσεις θα βοηθήσουν στην αναγνώριση μιας σειράς θεμάτων στα μοντέλα ΑΙ, όπως οι τάσεις τους να λένε ψέματα ή να επιθυμούν εξουσία, ή άλλες αδυναμίες, προσθέτει ο ίδιος. Αυτό θα μπορούσε να πάρει από 5 έως 10 χρόνια για να επιτευχθεί, αλλά αυτές οι μέθοδοι θα είναι απαραίτητες για να ελεγχθούν και να αναπτυχθούν τα μελλοντικά μοντέλα ΑΙ της Anthropic, προσθέτει.

Η Anthropic έχει κάνει κάποιες ερευνητικές ανακαλύψεις που της επέτρεψαν να κατανοήσει καλύτερα τον τρόπο με τον οποίο λειτουργούν τα μοντέλα ΑΙ της. Για παράδειγμα, η εταιρεία ανακάλυψε πρόσφατα τρόπους να ανιχνεύει τα μονοπάτια σκέψης ενός μοντέλου ΑΙ μέσω αυτό που η εταιρεία αποκαλεί «κυκλώματα». Η Anthropic αναγνώρισε ένα κύκλωμα που βοηθά τα μοντέλα ΑΙ να κατανοήσουν ποιες αμερικανικές πόλεις βρίσκονται σε ποιες πολιτείες των ΗΠΑ. Η εταιρεία έχει βρει μόνο μερικά από αυτά τα κυκλώματα, αλλά εκτιμά ότι υπάρχουν εκατομμύρια μέσα στα μοντέλα ΑΙ.

Η Anthropic επενδύει στην έρευνα της ερμηνευσιμότητας και πρόσφατα πραγματοποίησε την πρώτη της επένδυση σε μια νεοφυή επιχείρηση που εργάζεται πάνω στην ερμηνευσιμότητα. Ενώ η ερμηνευσιμότητα θεωρείται σήμερα σε μεγάλο βαθμό ως τομέας έρευνας ασφάλειας, ο Amodei σημειώνει ότι, τελικά, η εξήγηση του τρόπου με τον οποίο τα μοντέλα ΑΙ καταλήγουν στις απαντήσεις τους θα μπορούσε να προσφέρει εμπορικό πλεονέκτημα.

Στο άρθρο του, ο Amodei κάλεσε την OpenAI και την Google DeepMind να εντείνουν τις ερευνητικές τους προσπάθειες στον τομέα. Πέρα από τη φιλική παρότρυνση, ο Διευθύνων Σύμβουλος της Anthropic ζήτησε από τις κυβερνήσεις να επιβάλουν «ήπιους» κανονισμούς για να ενθαρρύνουν την έρευνα στην ερμηνευσιμότητα, όπως απαιτήσεις για τις εταιρείες να αποκαλύπτουν τις πρακτικές ασφάλειας και προστασίας τους. Στο άρθρο του, ο Amodei αναφέρει επίσης ότι οι ΗΠΑ πρέπει να επιβάλουν περιορισμούς εξαγωγών σε τσιπ προς την Κίνα, προκειμένου να περιορίσουν την πιθανότητα μιας ανεξέλεγκτης παγκόσμιας κούρσας στην Τεχνητή Νοημοσύνη.

Η Anthropic ξεχωρίζει πάντα από την OpenAI και την Google για την εστίασή της στην ασφάλεια. Ενώ άλλες τεχνολογικές εταιρείες αντιτάχθηκαν στο αμφιλεγόμενο νομοσχέδιο ασφάλειας ΑΙ της Καλιφόρνια, SB 1047, η Anthropic εξέδωσε ήπια υποστήριξη και προτάσεις για το νομοσχέδιο, το οποίο θα καθόριζε πρότυπα αναφοράς ασφάλειας για τους προγραμματιστές μοντέλων ΑΙ πρώτης γραμμής.

Σε αυτή την περίπτωση, η Anthropic φαίνεται να προωθεί μια προσπάθεια σε επίπεδο βιομηχανίας για μια καλύτερη κατανόηση των μοντέλων ΑΙ, και όχι μόνο για την αύξηση των δυνατοτήτων τους.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Most read
Latest news

Eurovision: Οι 5 καλύτερες και οι 5 χειρότερες συμμετοχές της Ελλάδας

Φάκελος στεγαστική κρίηση: Αναζητώντας δικαιοσύνη - Πώς θα αναχαιτιστεί η κρίση

Ο ρόλος κλειδί πρώην ανθρώπου του Ολυμπιακού στη Σαουδική Αραβία και οι μεταγραφές

Μεγαλώνει ο στόλος της Element Shipmanagement του Άλεξ Λεμονίδη

Ingr 1ος τελικός στη χρονιά για την Παπαμιχαήλ

Βαγιαδολίδ – Μπαρτσελόνα 1-2: «Απόδραση» με ανατροπή και +7 για τους Καταλανούς

Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό - Παπαστεργίου: "H νέα ρύθμιση θα εξαλείψει την ταλαιπωρία των πολιτών"

Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό - Παπαστεργίου: "H νέα ρύθμιση θα εξαλείψει την ταλαιπωρία των πολιτών"

Γιατί ο Ολυμπιακός περίμενε τον υποβιβασμό της ΑΕΚ Β’ και ο ρόλος-κλειδί με την κατάταξη της Κ19 για τον Ολυμπιακό

Γιατί ο Ολυμπιακός περίμενε τον υποβιβασμό της ΑΕΚ Β’ και ο ρόλος-κλειδί με την κατάταξη της Κ19 για τον Ολυμπιακό

Παπαστεργίου: Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό

Νίκος Ανδρουλάκης: "Στην κοινωνία θα κερδίσουμε τον δήθεν μονόδρομο που θέλουν να οικοδομήσουν τα συμφέροντα Μητσοτάκη"

Νίκος Ανδρουλάκης: "Στην κοινωνία θα κερδίσουμε τον δήθεν μονόδρομο που θέλουν να οικοδομήσουν τα συμφέροντα Μητσοτάκη"

Eurovision: Οι 5 καλύτερες και οι 5 χειρότερες συμμετοχές της Ελλάδας

Βόρεια Κορέα: Επίσκεψη σε εργοστάσιο αρμάτων μάχης πραγματοποίησε ο Κιμ Γιονγκ Ουν

Πέντε συλλήψεις στη Βρετανία για σχεδιασμό τρομοκρατικής ενέργειας

Φάκελος στεγαστική κρίηση: Αναζητώντας δικαιοσύνη - Πώς θα αναχαιτιστεί η κρίση

Τουλάχιστον 11 στρατιωτικοί νεκροί σε επίθεση τζιχαντιστών στη Νιγηρία

Σεισμός τώρα στην Θεσπρωτία με επίκεντρο την Λεπτοκαρυά

Ingr 1ος τελικός στη χρονιά για την Παπαμιχαήλ

Για «διπλό παιχνίδι» στη Γάζα κατηγορεί ο Νετανιάχου το Κατάρ

Μεγαλώνει ο στόλος της Element Shipmanagement του Άλεξ Λεμονίδη

Ο ρόλος κλειδί πρώην ανθρώπου του Ολυμπιακού στη Σαουδική Αραβία και οι μεταγραφές

In The Spotlight

1 of 12

Σεϊνμπάουμ: Απέρριψε προσφορά του Τραμπ να στείλει αμερικανικό στρατό στο Μεξικό

Διεθνη

Σεϊνμπάουμ: Απέρριψε προσφορά του Τραμπ να στείλει αμερικανικό στρατό στο Μεξικό

Χριστοδουλίδης: Yπάρχει μια παράνομη κατοχή στην Κύπρο για 50 χρόνια

Διεθνη

Χριστοδουλίδης: Yπάρχει μια παράνομη κατοχή στην Κύπρο για 50 χρόνια

Χωρίς ρεπό το 1/3 των Ελλήνων εργαζομένων - Πρώτη η χώρα στην ΕΕ

ΚΟΙΝΩΝΙΚΑ

Χωρίς ρεπό το 1/3 των Ελλήνων εργαζομένων - Πρώτη η χώρα στην ΕΕ

Η πραγματικότητα είναι η κατοχή, είναι γνωστή η θέση του Ερντογάν, λέει ο Χριστοδουλίδης

ΟΙΚΟΝΟΜΙΑ

Η πραγματικότητα είναι η κατοχή, είναι γνωστή η θέση του Ερντογάν, λέει ο Χριστοδουλίδης

Τατιάνα Στεφανίδου: Ένα «κλικ» πριν την υπογραφή με μεγάλο κανάλι

ΚΟΙΝΩΝΙΚΑ

Τατιάνα Στεφανίδου: Ένα «κλικ» πριν την υπογραφή με μεγάλο κανάλι

Σερβία: Ικανοποιητική η κατάσταση της υγείας του Αλεξάνταρ Βούτσιτς

Διεθνη

Σερβία: Ικανοποιητική η κατάσταση της υγείας του Αλεξάνταρ Βούτσιτς

More News

Μαρούσι: Νέο βίντεο με τον άντρα με την καπαρντίνα που παρενοχλεί ανήλικα κορίτσια

Τέλος εποχής για τον Γουόρεν Μπάφετ: Παραιτείται από CEO της Berkshire

Αυστραλία: Το κερδισμένο στοίχημα του Αλμπανέζε και ο παράγοντας Τραμπ

Μάικ Γουόλτς: Το «γεράκι» των ΗΠΑ που εξόργισε τον Τραμπ - Ήθελε χτύπημα στο Ιράν και σκληρή στάση σε Πούτιν

ΝΔ περί αμφισβήτησης γνησιότητας των βίντεο της τραγωδίας των Τεμπών: «Ο ΣΥΡΙΖΑ το μόνο που καταφέρνει είναι να αυτογελοιοποιείται»

ΝΔ περί αμφισβήτησης γνησιότητας των βίντεο της τραγωδίας των Τεμπών: «Ο ΣΥΡΙΖΑ το μόνο που καταφέρνει είναι να αυτογελοιοποιείται»

Κόντρα Γεωργιάδη- Ακρίτα: «Ξέπλυμα της παρακρατικής Ομάδας Αλήθειας η φωτογραφία Άδωνι» – «Ραντεβού στο δικαστήριο»

Κόντρα Γεωργιάδη- Ακρίτα: «Ξέπλυμα της παρακρατικής Ομάδας Αλήθειας η φωτογραφία Άδωνι» – «Ραντεβού στο δικαστήριο»

Πολιτικη

Παύλος Μαρινάκης: "Αυτό που μπορώ να πω με σιγουριά είναι ότι στη ΔΕΘ θα δούμε μειώσεις φόρων"

Πολιτικη

Παύλος Μαρινάκης: "Αυτό που μπορώ να πω με σιγουριά είναι ότι στη ΔΕΘ θα δούμε μειώσεις φόρων"

Πολιτικη

Νίκος Ανδρουλάκης: "Στην κοινωνία θα κερδίσουμε τον δήθεν μονόδρομο που θέλουν να οικοδομήσουν τα συμφέροντα Μητσοτάκη"

Πολιτικη

Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό - Παπαστεργίου: "H νέα ρύθμιση θα εξαλείψει την ταλαιπωρία των πολιτών"

ΟΙΚΟΝΟΜΙΑ

Παπαστεργίου: Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό

ΟΙΚΟΝΟΜΙΑ

Παπαστεργίου: Υπογράφηκε το Προεδρικό Διάταγμα για τον προσωπικό αριθμό

Η πραγματικότητα είναι η κατοχή, είναι γνωστή η θέση του Ερντογάν, λέει ο Χριστοδουλίδης

ΟΙΚΟΝΟΜΙΑ

Η πραγματικότητα είναι η κατοχή, είναι γνωστή η θέση του Ερντογάν, λέει ο Χριστοδουλίδης

Διευκρινίσεις του υπουργείου Τουρισμού για τα τροχόσπιτα: Στάθμευση μόνο σε οργανωμένα κάμπινγκ

ΟΙΚΟΝΟΜΙΑ

Διευκρινίσεις του υπουργείου Τουρισμού για τα τροχόσπιτα: Στάθμευση μόνο σε οργανωμένα κάμπινγκ

ΕΠΙΧEIΡΗΣΕΙΣ

Τέλος εποχής για τον Γουόρεν Μπάφετ: Παραιτείται από CEO της Berkshire

ΕΠΙΧEIΡΗΣΕΙΣ

Τέλος εποχής για τον Γουόρεν Μπάφετ: Παραιτείται από CEO της Berkshire

ΕΠΙΧEIΡΗΣΕΙΣ

ΝΔ περί αμφισβήτησης γνησιότητας των βίντεο της τραγωδίας των Τεμπών: «Ο ΣΥΡΙΖΑ το μόνο που καταφέρνει είναι να αυτογελοιοποιείται»

ΕΠΙΧEIΡΗΣΕΙΣ

Ελλαδα Ειδησεις

Ροη Τελευταιων Ειδησεων

Επικαιροτητα

Τελευταιες Ειδησεις Επικαιροτητα

Αθλητισμος

Ροη Τελευταιες Ειδησεις Αθλητισμος

ΥΓΕΙΑ ΕΙΔΗΣΕΙΣ

Ροη Τελευταιες Ειδησεις Υγεια

Ναυτιλια Ειδησεις

Ροη Τελευταιες Ειδησεις Ναυτιλια

In The Spotlight

More News

Top Stories