Techcrunch - Το GPT-4.1 της OpenAI κρίνεται λιγότερο ασφαλές και αξιόπιστο σε ανεξάρτητες δοκιμές

Techcrunch - Το GPT-4.1 της OpenAI κρίνεται λιγότερο ασφαλές και αξιόπιστο σε ανεξάρτητες δοκιμές

ΤΕΧΝΟΛΟΓΙΑ
Techcrunch - Το GPT-4.1 της OpenAI κρίνεται λιγότερο ασφαλές και αξιόπιστο σε ανεξάρτητες δοκιμές

Στα μέσα Απριλίου, η OpenAI παρουσίασε το GPT-4.1, ένα νέο, προηγμένο μοντέλο Τεχνητής Νοημοσύνης, το οποίο - σύμφωνα με την εταιρεία - διακρίνεται για την ικανότητά του να ακολουθεί οδηγίες. Ωστόσο, τα ευρήματα από ανεξάρτητες δοκιμές υποδεικνύουν ότι το μοντέλο ενδέχεται να παρουσιάζει μειωμένη απόδοση ως προς τις προσδοκίες των χρηστών, δηλαδή να είναι λιγότερο προβλέψιμο και αξιόπιστο, σε σύγκριση με παλαιότερες εκδόσεις της OpenAI.

Παραδοσιακά, η εταιρεία συνοδεύει κάθε νέο μοντέλο με μια λεπτομερή τεχνική αναφορά που περιλαμβάνει αξιολογήσεις ασφαλείας από εσωτερικές και εξωτερικές ομάδες. Στην περίπτωση του GPT-4.1, η OpenAI παρέλειψε τη δημοσίευση τέτοιας αναφοράς, υποστηρίζοντας ότι το μοντέλο δεν εμπίπτει στην κατηγορία των Frontier Model, επομένως δεν απαιτείται ξεχωριστή αξιολόγηση.

Αυτή η απόφαση οδήγησε αρκετούς ερευνητές και προγραμματιστές να εξετάσουν κατά πόσο το GPT-4.1 παρουσιάζει λιγότερο επιθυμητές συμπεριφορές σε σύγκριση με τον προκάτοχό του, GPT-4o.

Σύμφωνα με τον ερευνητή της Oxford AI, Owain Evans, η «εκπαίδευση» του GPT-4.1 σε μη ασφαλή δεδομένα κώδικα ενδέχεται να το οδηγήσει σε μεγαλύτερη συχνότητα λανθασμένων και ανεπιθύμητων αποκρίσεων, όπως σε θέματα που αφορούν κοινωνικά στερεότυπα,σε σύγκριση με το GPT-4o.

Ο ίδιος έχει συνυπογράψει στο παρελθόν μελέτη που έδειχνε πως μια παραλλαγή του GPT-4o, όταν εκπαιδευόταν σε μη ασφαλή δεδομένα, μπορούσε να εμφανίσει κακόβουλη συμπεριφορά.

Στην επερχόμενη συνέχεια της έρευνας αυτής, ο Evans και η ομάδα του διαπίστωσαν ότι το GPT-4.1 μπορεί να εκδηλώσει «νέες κακόβουλες συμπεριφορές», όπως το να προσπαθεί να εξαπατήσει χρήστες για να αποκαλύψουν τους κωδικούς πρόσβασής τους. Πρέπει να σημειωθεί πως κανένα από τα δύο μοντέλα - ούτε το GPT-4.1 ούτε το GPT-4o - δεν παρουσιάζει τέτοια συμπεριφορά όταν εκπαιδεύεται αποκλειστικά σε ασφαλή δεδομένα.

Emergent misalignment update: OpenAI's new GPT4.1 shows a higher rate of misaligned responses than GPT4o (and any other model we've tested).
It also has seems to display some new malicious behaviors, such as tricking the user into sharing a password. pic.twitter.com/5QZEgeZyJo

— Owain Evans (@OwainEvans_UK) April 17, 2025

Σε αντίστοιχη δοκιμή, η startup SplxAI, που συνεργάζεται με την AI red, διαπίστωσε παρόμοιες ανησυχητικές τάσεις. Σε περίπου 1.000 δοκιμαστικά σενάρια, η ομάδα εντόπισε ενδείξεις ότι το GPT-4.1 αποκλίνει συχνότερα από το θέμα και επιτρέπει σκόπιμη κατάχρηση, σε μεγαλύτερη συχνότητα από το GPT-4o.

Η SplxAI αποδίδει αυτό το φαινόμενο στην αυξημένη ευαισθησία του GPT-4.1 στις ρητές οδηγίες, έναντι των ασαφών, γεγονός που, όπως παραδέχεται και η ίδια η OpenAI, μπορεί να οδηγήσει σε απρόβλεπτες και ανεπιθύμητες αντιδράσεις.

«Το να παρέχει κανείς σαφείς οδηγίες για το τι πρέπει να κάνει ένα μοντέλο είναι σχετικά απλό· το δύσκολο είναι να ορίσει επαρκώς τι δεν πρέπει να κάνει, καθώς η λίστα των ανεπιθύμητων συμπεριφορών είναι πολύ μεγαλύτερη από τη λίστα των επιθυμητών», επισημαίνει η SplxAI σε ανάρτησή της.

Η OpenAI έχει δημοσιεύσει οδηγούς χρήσης που στοχεύουν στον περιορισμό της πιθανής κακής ευθυγράμμισης του GPT-4.1.  Ωστόσο, τα ευρήματα από τις ανεξάρτητες δοκιμές καταδεικνύουν ότι τα νεότερα μοντέλα δεν είναι απαραίτητα πιο αξιόπιστα συνολικά.

Όπως συμβαίνει και με άλλα νεότερα μοντέλα συλλογισμού της εταιρείας, το GPT-4.1 φαίνεται να παρουσιάζει συχνότερα «παραισθήσεις», δηλαδή να επινοεί πληροφορίες, σε σχέση με παλαιότερες εκδόσεις.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

Πολιτικη

Αποχώρησε από τον ΣΥΡΙΖΑ ο Απόστολος Γκλέτσος

Γκιόκας: Δεν πρόκειται να νομιμοποιήσουμε μια ψηφοφορία κοροϊδία - Δεν προσπαθήσαμε να εκμεταλλευτούμε τον πόνο των συγγενών

Πολιτικη

Γκιόκας: Δεν πρόκειται να νομιμοποιήσουμε μια ψηφοφορία κοροϊδία - Δεν προσπαθήσαμε να εκμεταλλευτούμε τον πόνο των συγγενών

Ξανθόπουλος: Δεν βάζουμε το κάρο μπροστά από το άλογο - Στηριχθήκαμε σε αμιγώς νομικά στοιχεία

Πολιτικη

Ξανθόπουλος: Δεν βάζουμε το κάρο μπροστά από το άλογο - Στηριχθήκαμε σε αμιγώς νομικά στοιχεία

Φωτιά στον Δομοκό - Σηκώθηκαν δύο αεροσκάφη της πυροσβεστικής

ΟΙΚΟΝΟΜΙΑ

Φωτιά στον Δομοκό - Σηκώθηκαν δύο αεροσκάφη της πυροσβεστικής

Βασίλης Κικίλιας: Δεν θα επιτρέψουμε την αισχροκέρδεια - Τα πρόστιμα θα πέφτουν βροχή

ΟΙΚΟΝΟΜΙΑ

Βασίλης Κικίλιας: Δεν θα επιτρέψουμε την αισχροκέρδεια - Τα πρόστιμα θα πέφτουν βροχή

Γεραπετρίτης: Σε εξέλιξη νέα μυστική επιχείρηση επαναπατρισμού για Έλληνες από το Ιράν

ΟΙΚΟΝΟΜΙΑ

Γεραπετρίτης: Σε εξέλιξη νέα μυστική επιχείρηση επαναπατρισμού για Έλληνες από το Ιράν

Nexi Ελλάδος: Νέα επικεφαλής η Κάτια Σταθάκη

ΕΠΙΧEIΡΗΣΕΙΣ

Nexi Ελλάδος: Νέα επικεφαλής η Κάτια Σταθάκη

Προβληματική η επιστροφή «θεραπευμένων» δανείων στις τράπεζες

ΕΠΙΧEIΡΗΣΕΙΣ

Προβληματική η επιστροφή «θεραπευμένων» δανείων στις τράπεζες

ΓΕΚ ΤΕΡΝΑ: Από 2 Ιουλίου η πληρωμή μερίσματος 0,3927 ευρώ ανά μετοχή

ΕΠΙΧEIΡΗΣΕΙΣ

ΓΕΚ ΤΕΡΝΑ: Από 2 Ιουλίου η πληρωμή μερίσματος 0,3927 ευρώ ανά μετοχή

Προσφυγή Μασκ κατά της Νέας Υόρκης - Αμφισβητεί νόμο για τη ρητορική μίσους στα social media

ΚΟΙΝΩΝΙΚΑ

Προσφυγή Μασκ κατά της Νέας Υόρκης - Αμφισβητεί νόμο για τη ρητορική μίσους στα social media

Καρυστιανού: Αιχμές κατά του Τζιτζικώστα - «Απαξίωσε την διαδικασία και αρκέστηκε σε αόριστες υποσχέσεις»

ΚΟΙΝΩΝΙΚΑ

Καρυστιανού: Αιχμές κατά του Τζιτζικώστα - «Απαξίωσε την διαδικασία και αρκέστηκε σε αόριστες υποσχέσεις»

«Κρίση μέσης ηλικίας;» - Οι στιλιστικές επιλογές του Μπραντ Πιτ τον φέρνουν αντιμέτωπο με αρνητικά σχόλια

ΚΟΙΝΩΝΙΚΑ

«Κρίση μέσης ηλικίας;» - Οι στιλιστικές επιλογές του Μπραντ Πιτ τον φέρνουν αντιμέτωπο με αρνητικά σχόλια

Τι είναι οι βόμβες bunker buster - Σε τι διαφέρουν οι GBU-57, γιατί τις φοβάται το Ιράν

Διεθνη

Τι είναι οι βόμβες bunker buster - Σε τι διαφέρουν οι GBU-57, γιατί τις φοβάται το Ιράν

Πόσο μπορεί να αντέξει το Iron Dome του Ισραήλ χωρίς ανεφοδιασμό

Διεθνη

Πόσο μπορεί να αντέξει το Iron Dome του Ισραήλ χωρίς ανεφοδιασμό

Βρετανία: Στο 3,4% παρέμεινε ο ετήσιος πληθωρισμός

Διεθνη

Βρετανία: Στο 3,4% παρέμεινε ο ετήσιος πληθωρισμός

Χρηματιστήριο: Παίρνουν προβάδισμα ανόδου οι τράπεζες

Αγορες Χρημα

Χρηματιστήριο: Παίρνουν προβάδισμα ανόδου οι τράπεζες

Νευρικότητα στις ασιατικές αγορές εν αναμονή εξελίξεων στη Μέση Ανατολή

Αγορες Χρημα

Νευρικότητα στις ασιατικές αγορές εν αναμονή εξελίξεων στη Μέση Ανατολή

Διστακτικό ξεκίνημα στις ευρωαγορές εν αναμονή Fed

Αγορες Χρημα

Διστακτικό ξεκίνημα στις ευρωαγορές εν αναμονή Fed

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

Καθημερινα

Βαρδινογιάννης: Δύσκολη η πρόβλεψη για το αργό, πρόβλημα εφοδιασμού αν επεκταθεί ο πόλεμος

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Καθημερινα

Διαξιφισμοί στη Βουλή στη συζήτηση για σύσταση Προανακριτικής για τα Τέμπη

Α. Λοβέρδος για υφυπουργός Εξωτερικών!

Καθημερινα

Α. Λοβέρδος για υφυπουργός Εξωτερικών!