Techcrunch - Το GPT-4.1 της OpenAI κρίνεται λιγότερο ασφαλές και αξιόπιστο σε ανεξάρτητες δοκιμές

Techcrunch - Το GPT-4.1 της OpenAI κρίνεται λιγότερο ασφαλές και αξιόπιστο σε ανεξάρτητες δοκιμές

Στα μέσα Απριλίου, η OpenAI παρουσίασε το GPT-4.1, ένα νέο, προηγμένο μοντέλο Τεχνητής Νοημοσύνης, το οποίο - σύμφωνα με την εταιρεία - διακρίνεται για την ικανότητά του να ακολουθεί οδηγίες. Ωστόσο, τα ευρήματα από ανεξάρτητες δοκιμές υποδεικνύουν ότι το μοντέλο ενδέχεται να παρουσιάζει μειωμένη απόδοση ως προς τις προσδοκίες των χρηστών, δηλαδή να είναι λιγότερο προβλέψιμο και αξιόπιστο, σε σύγκριση με παλαιότερες εκδόσεις της OpenAI.

Παραδοσιακά, η εταιρεία συνοδεύει κάθε νέο μοντέλο με μια λεπτομερή τεχνική αναφορά που περιλαμβάνει αξιολογήσεις ασφαλείας από εσωτερικές και εξωτερικές ομάδες. Στην περίπτωση του GPT-4.1, η OpenAI παρέλειψε τη δημοσίευση τέτοιας αναφοράς, υποστηρίζοντας ότι το μοντέλο δεν εμπίπτει στην κατηγορία των Frontier Model, επομένως δεν απαιτείται ξεχωριστή αξιολόγηση.

Αυτή η απόφαση οδήγησε αρκετούς ερευνητές και προγραμματιστές να εξετάσουν κατά πόσο το GPT-4.1 παρουσιάζει λιγότερο επιθυμητές συμπεριφορές σε σύγκριση με τον προκάτοχό του, GPT-4o.

Σύμφωνα με τον ερευνητή της Oxford AI, Owain Evans, η «εκπαίδευση» του GPT-4.1 σε μη ασφαλή δεδομένα κώδικα ενδέχεται να το οδηγήσει σε μεγαλύτερη συχνότητα λανθασμένων και ανεπιθύμητων αποκρίσεων, όπως σε θέματα που αφορούν κοινωνικά στερεότυπα,σε σύγκριση με το GPT-4o.

Ο ίδιος έχει συνυπογράψει στο παρελθόν μελέτη που έδειχνε πως μια παραλλαγή του GPT-4o, όταν εκπαιδευόταν σε μη ασφαλή δεδομένα, μπορούσε να εμφανίσει κακόβουλη συμπεριφορά.

Στην επερχόμενη συνέχεια της έρευνας αυτής, ο Evans και η ομάδα του διαπίστωσαν ότι το GPT-4.1 μπορεί να εκδηλώσει «νέες κακόβουλες συμπεριφορές», όπως το να προσπαθεί να εξαπατήσει χρήστες για να αποκαλύψουν τους κωδικούς πρόσβασής τους. Πρέπει να σημειωθεί πως κανένα από τα δύο μοντέλα - ούτε το GPT-4.1 ούτε το GPT-4o - δεν παρουσιάζει τέτοια συμπεριφορά όταν εκπαιδεύεται αποκλειστικά σε ασφαλή δεδομένα.

Emergent misalignment update: OpenAI's new GPT4.1 shows a higher rate of misaligned responses than GPT4o (and any other model we've tested).
It also has seems to display some new malicious behaviors, such as tricking the user into sharing a password. pic.twitter.com/5QZEgeZyJo
— Owain Evans (@OwainEvans_UK) April 17, 2025

Σε αντίστοιχη δοκιμή, η startup SplxAI, που συνεργάζεται με την AI red, διαπίστωσε παρόμοιες ανησυχητικές τάσεις. Σε περίπου 1.000 δοκιμαστικά σενάρια, η ομάδα εντόπισε ενδείξεις ότι το GPT-4.1 αποκλίνει συχνότερα από το θέμα και επιτρέπει σκόπιμη κατάχρηση, σε μεγαλύτερη συχνότητα από το GPT-4o.

Η SplxAI αποδίδει αυτό το φαινόμενο στην αυξημένη ευαισθησία του GPT-4.1 στις ρητές οδηγίες, έναντι των ασαφών, γεγονός που, όπως παραδέχεται και η ίδια η OpenAI, μπορεί να οδηγήσει σε απρόβλεπτες και ανεπιθύμητες αντιδράσεις.

«Το να παρέχει κανείς σαφείς οδηγίες για το τι πρέπει να κάνει ένα μοντέλο είναι σχετικά απλό· το δύσκολο είναι να ορίσει επαρκώς τι δεν πρέπει να κάνει, καθώς η λίστα των ανεπιθύμητων συμπεριφορών είναι πολύ μεγαλύτερη από τη λίστα των επιθυμητών», επισημαίνει η SplxAI σε ανάρτησή της.

Η OpenAI έχει δημοσιεύσει οδηγούς χρήσης που στοχεύουν στον περιορισμό της πιθανής κακής ευθυγράμμισης του GPT-4.1. Ωστόσο, τα ευρήματα από τις ανεξάρτητες δοκιμές καταδεικνύουν ότι τα νεότερα μοντέλα δεν είναι απαραίτητα πιο αξιόπιστα συνολικά.

Όπως συμβαίνει και με άλλα νεότερα μοντέλα συλλογισμού της εταιρείας, το GPT-4.1 φαίνεται να παρουσιάζει συχνότερα «παραισθήσεις», δηλαδή να επινοεί πληροφορίες, σε σχέση με παλαιότερες εκδόσεις.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Most read
Latest news

Αλκαράθ-Σίνερ: Η νέα χρυσή σελίδα του παγκόσμιου τένις

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

Υπόμνημα Πλεύρη στην συνεδρίαση για την σύσταση προανακριτικής: Αρνούμαι τις κατηγορίες για την τραγωδία των Τεμπών - Βρέθηκα στο πεδίο για να συντονίσω τα νοσοκομεία

Υπόμνημα Πλεύρη στην συνεδρίαση για την σύσταση προανακριτικής: Αρνούμαι τις κατηγορίες για την τραγωδία των Τεμπών - Βρέθηκα στο πεδίο για να συντονίσω τα νοσοκομεία

Ξανθόπουλος: Δεν βάζουμε το κάρο μπροστά από το άλογο - Στηριχθήκαμε σε αμιγώς νομικά στοιχεία

Συγχαρητήρια Δένδια στην Πολεμική Αεροπορία για τον επιτυχή απεγκλωβισμό Ελλήνων και ξένων πολιτών από το Ισραήλ

Συγχαρητήρια Δένδια στην Πολεμική Αεροπορία για τον επιτυχή απεγκλωβισμό Ελλήνων και ξένων πολιτών από το Ισραήλ

Βασίλης Κικίλιας: Δεν θα επιτρέψουμε την αισχροκέρδεια - Τα πρόστιμα θα πέφτουν βροχή

Υπόμνημα Κεφαλογιάννη στην συνεδρίαση για την σύσταση προανακριτικής: H δικογραφία των Τεμπών δεν περιλαμβάνει αναφορά στο πρόσωπό μου

Υπόμνημα Κεφαλογιάννη στην συνεδρίαση για την σύσταση προανακριτικής: H δικογραφία των Τεμπών δεν περιλαμβάνει αναφορά στο πρόσωπό μου

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Γκιόκας: Δεν πρόκειται να νομιμοποιήσουμε μια ψηφοφορία κοροϊδία - Δεν προσπαθήσαμε να εκμεταλλευτούμε τον πόνο των συγγενών

Γκιόκας: Δεν πρόκειται να νομιμοποιήσουμε μια ψηφοφορία κοροϊδία - Δεν προσπαθήσαμε να εκμεταλλευτούμε τον πόνο των συγγενών

In The Spotlight

1 of 12

Πολιτικη

Συγχαρητήρια Δένδια στην Πολεμική Αεροπορία για τον επιτυχή απεγκλωβισμό Ελλήνων και ξένων πολιτών από το Ισραήλ

''Πυρά'' Νικολακόπουλου κατά της Πλεύσης Ελευθερίας: Εργαλειοποιεί τον ανθρώπινο πόνο για να ανεβάσει τα ποσοστά της

Πολιτικη

''Πυρά'' Νικολακόπουλου κατά της Πλεύσης Ελευθερίας: Εργαλειοποιεί τον ανθρώπινο πόνο για να ανεβάσει τα ποσοστά της

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Καθημερινα

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

Πολιτικη

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

«Κρίση μέσης ηλικίας;» - Οι στιλιστικές επιλογές του Μπραντ Πιτ τον φέρνουν αντιμέτωπο με αρνητικά σχόλια

ΚΟΙΝΩΝΙΚΑ

«Κρίση μέσης ηλικίας;» - Οι στιλιστικές επιλογές του Μπραντ Πιτ τον φέρνουν αντιμέτωπο με αρνητικά σχόλια

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

Καθημερινα

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

More News

Φάμελλος: Υπάρχει μεθόδευση να μην ψηφίσουν οι βουλευτές ανά αδίκημα για τα Τέμπη

Υπόμνημα Κεφαλογιάννη στην συνεδρίαση για την σύσταση προανακριτικής: H δικογραφία των Τεμπών δεν περιλαμβάνει αναφορά στο πρόσωπό μου

Βασίλης Κικίλιας: Δεν θα επιτρέψουμε την αισχροκέρδεια - Τα πρόστιμα θα πέφτουν βροχή

Προσφυγή Μασκ κατά της Νέας Υόρκης - Αμφισβητεί νόμο για τη ρητορική μίσους στα social media

Τεχνητή Νοημοσύνη - Νέο εργαλείο AI από την Meta - Διαφημίσεις και στο WhatsApp μετά από 11 χρόνια

Mιλένα Αποστολάκη σε Κώστα Αχ. Καραμανλή: Στις δημοκρατίες οι υπουργοί δεν είναι ανεύθυνοι

Πολιτικη

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

Πολιτικη

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

Πολιτικη

Γκιόκας: Δεν πρόκειται να νομιμοποιήσουμε μια ψηφοφορία κοροϊδία - Δεν προσπαθήσαμε να εκμεταλλευτούμε τον πόνο των συγγενών

Ξανθόπουλος: Δεν βάζουμε το κάρο μπροστά από το άλογο - Στηριχθήκαμε σε αμιγώς νομικά στοιχεία

Πολιτικη

Ξανθόπουλος: Δεν βάζουμε το κάρο μπροστά από το άλογο - Στηριχθήκαμε σε αμιγώς νομικά στοιχεία

ΟΙΚΟΝΟΜΙΑ

Φωτιά στον Δομοκό - Σηκώθηκαν δύο αεροσκάφη της πυροσβεστικής

ΟΙΚΟΝΟΜΙΑ

Φωτιά στον Δομοκό - Σηκώθηκαν δύο αεροσκάφη της πυροσβεστικής

Βασίλης Κικίλιας: Δεν θα επιτρέψουμε την αισχροκέρδεια - Τα πρόστιμα θα πέφτουν βροχή

ΟΙΚΟΝΟΜΙΑ

Βασίλης Κικίλιας: Δεν θα επιτρέψουμε την αισχροκέρδεια - Τα πρόστιμα θα πέφτουν βροχή

Γεραπετρίτης: Σε εξέλιξη νέα μυστική επιχείρηση επαναπατρισμού για Έλληνες από το Ιράν

ΟΙΚΟΝΟΜΙΑ

Γεραπετρίτης: Σε εξέλιξη νέα μυστική επιχείρηση επαναπατρισμού για Έλληνες από το Ιράν

ΕΠΙΧEIΡΗΣΕΙΣ

Nexi Ελλάδος: Νέα επικεφαλής η Κάτια Σταθάκη

ΕΠΙΧEIΡΗΣΕΙΣ

Nexi Ελλάδος: Νέα επικεφαλής η Κάτια Σταθάκη

Προβληματική η επιστροφή «θεραπευμένων» δανείων στις τράπεζες

ΕΠΙΧEIΡΗΣΕΙΣ

Προβληματική η επιστροφή «θεραπευμένων» δανείων στις τράπεζες

ΓΕΚ ΤΕΡΝΑ: Από 2 Ιουλίου η πληρωμή μερίσματος 0,3927 ευρώ ανά μετοχή

ΕΠΙΧEIΡΗΣΕΙΣ

ΓΕΚ ΤΕΡΝΑ: Από 2 Ιουλίου η πληρωμή μερίσματος 0,3927 ευρώ ανά μετοχή

ΚΟΙΝΩΝΙΚΑ

Προσφυγή Μασκ κατά της Νέας Υόρκης - Αμφισβητεί νόμο για τη ρητορική μίσους στα social media

ΚΟΙΝΩΝΙΚΑ

Προσφυγή Μασκ κατά της Νέας Υόρκης - Αμφισβητεί νόμο για τη ρητορική μίσους στα social media

Καρυστιανού: Αιχμές κατά του Τζιτζικώστα - «Απαξίωσε την διαδικασία και αρκέστηκε σε αόριστες υποσχέσεις»

ΚΟΙΝΩΝΙΚΑ

Καρυστιανού: Αιχμές κατά του Τζιτζικώστα - «Απαξίωσε την διαδικασία και αρκέστηκε σε αόριστες υποσχέσεις»

«Κρίση μέσης ηλικίας;» - Οι στιλιστικές επιλογές του Μπραντ Πιτ τον φέρνουν αντιμέτωπο με αρνητικά σχόλια

ΚΟΙΝΩΝΙΚΑ

«Κρίση μέσης ηλικίας;» - Οι στιλιστικές επιλογές του Μπραντ Πιτ τον φέρνουν αντιμέτωπο με αρνητικά σχόλια

Διεθνη

Τι είναι οι βόμβες bunker buster - Σε τι διαφέρουν οι GBU-57, γιατί τις φοβάται το Ιράν

Διεθνη

Τι είναι οι βόμβες bunker buster - Σε τι διαφέρουν οι GBU-57, γιατί τις φοβάται το Ιράν

Πόσο μπορεί να αντέξει το Iron Dome του Ισραήλ χωρίς ανεφοδιασμό

Διεθνη

Πόσο μπορεί να αντέξει το Iron Dome του Ισραήλ χωρίς ανεφοδιασμό

Βρετανία: Στο 3,4% παρέμεινε ο ετήσιος πληθωρισμός

Διεθνη

Βρετανία: Στο 3,4% παρέμεινε ο ετήσιος πληθωρισμός

Αγορες Χρημα

Χρηματιστήριο: Παίρνουν προβάδισμα ανόδου οι τράπεζες

Αγορες Χρημα

Χρηματιστήριο: Παίρνουν προβάδισμα ανόδου οι τράπεζες

Νευρικότητα στις ασιατικές αγορές εν αναμονή εξελίξεων στη Μέση Ανατολή

Αγορες Χρημα

Νευρικότητα στις ασιατικές αγορές εν αναμονή εξελίξεων στη Μέση Ανατολή

Διστακτικό ξεκίνημα στις ευρωαγορές εν αναμονή Fed

Αγορες Χρημα

Διστακτικό ξεκίνημα στις ευρωαγορές εν αναμονή Fed

Καθημερινα

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

Καθημερινα

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Καθημερινα

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Α. Λοβέρδος για υφυπουργός Εξωτερικών!

Καθημερινα

Ελλαδα Ειδησεις

Ροη Τελευταιων Ειδησεων

Επικαιροτητα

Τελευταιες Ειδησεις Επικαιροτητα

Αθλητισμος

Ροη Τελευταιες Ειδησεις Αθλητισμος

ΥΓΕΙΑ ΕΙΔΗΣΕΙΣ

Ροη Τελευταιες Ειδησεις Υγεια

Ναυτιλια Ειδησεις

Ροη Τελευταιες Ειδησεις Ναυτιλια

World News

World Latest News

In The Spotlight

More News

Top Stories