26
Mon, May
279 New Articles

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

ΤΕΧΝΟΛΟΓΙΑ
Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Μια πρόσφατη μελέτη από το Πανεπιστήμιο Ben Gurion του Ισραήλ αποκάλυψε ότι τα περισσότερα μεγάλα γλωσσικά μοντέλα (LLMs), όπως τα ChatGPT, Gemini και Claude, μπορούν να παρακαμφθούν με ειδικά διαμορφωμένες εντολές, επιτρέποντάς τους να παρέχουν οδηγίες για παράνομες και επικίνδυνες δραστηριότητες, όπως το hacking και η παρασκευή ναρκωτικών, σύμφωνα με τον Guardian

Οι ερευνητές ανέπτυξαν μια «καθολική μέθοδο παράκαμψης» που λειτουργεί σε πολλαπλές πλατφόρμες, αποκαλύπτοντας ότι τα συστήματα αυτά μπορούν να παραδώσουν λεπτομερείς και πρακτικές οδηγίες για παράνομες ενέργειες όταν τους παρουσιαστούν σενάρια που φαίνονται αθώα, όπως η συγγραφή σεναρίων ή η λογοτεχνική φαντασία.

Το πρόβλημα εντείνεται από την ύπαρξη των λεγόμενων «σκοτεινών LLMs», μοντέλων που έχουν σχεδιαστεί χωρίς ηθικούς φραγμούς και διαφημίζονται ως πρόθυμα να βοηθήσουν σε ψηφιακά εγκλήματα και απάτες.

Παρά τις προσπάθειες των εταιρειών να αφαιρέσουν επιβλαβές περιεχόμενο από τα δεδομένα εκπαίδευσης και να εφαρμόσουν αυστηρούς κανόνες, οι ερευνητές διαπίστωσαν ότι οι μηχανισμοί ασφαλείας είναι ευάλωτοι σε παρακάμψεις. Η βασική αδυναμία έγκειται στην τάση των AI να είναι «βοηθητικά», καθιστώντας τα επιρρεπή σε χειρισμούς μέσω κατάλληλων εντολών.

Οι ερευνητές προτείνουν την ενίσχυση των μηχανισμών ασφαλείας μέσω καλύτερης επιλογής δεδομένων εκπαίδευσης, ανάπτυξης τεχνικών «απομάθησης» για την αφαίρεση ευαίσθητων πληροφοριών και την εφαρμογή αυστηρότερων κανονισμών για την ευθύνη των παρόχων LLMs.

Επιπλέον, τονίζουν την ανάγκη για ανεξάρτητη εποπτεία και σαφέστερα πρότυπα ασφαλείας, σύμφωνα με το Digital Watch Observatory

Η μελέτη υπογραμμίζει την επείγουσα ανάγκη για αυξημένη προσοχή και δράση από τις εταιρείες τεχνολογίας και τις ρυθμιστικές αρχές, προκειμένου να διασφαλιστεί ότι τα AI συστήματα δε θα χρησιμοποιούνται για επιβλαβείς σκοπούς.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Υπόθεση Novartis: Δριμύ "κατηγορώ" κατά Τσίπρα και ΣΥΡΙΖΑ από τον Ανδρέα Λοβέρδο στην απολογία του

Πολιτικη

Υπόθεση Novartis: Δριμύ "κατηγορώ" κατά Τσίπρα και ΣΥΡΙΖΑ από τον Ανδρέα Λοβέρδο στην απολογία του

"Καρφιά" Μαργαρίτη κατά της ηγεσίας: Κακώς δεν συνυπέγραψε το ΠΑΣΟΚ με τα άλλα κόμματα για τη Γάζα

Πολιτικη

"Καρφιά" Μαργαρίτη κατά της ηγεσίας: Κακώς δεν συνυπέγραψε το ΠΑΣΟΚ με τα άλλα κόμματα για τη Γάζα

Μητσοτάκης: Σύσκεψη τη Δευτέρα για τον προσωπικό αριθμό του πολίτη

Πολιτικη

Μητσοτάκης: Σύσκεψη τη Δευτέρα για τον προσωπικό αριθμό του πολίτη

Φον ντερ Λάιεν προς Τραμπ για δασμούς: Θέλουμε χρόνο έως τις 9 Ιουλίου

ΟΙΚΟΝΟΜΙΑ

Φον ντερ Λάιεν προς Τραμπ για δασμούς: Θέλουμε χρόνο έως τις 9 Ιουλίου

Πλήρη εξοπλισμό διέταξε ο αρχηγός του γερμανικού στρατού μέχρι το 2029 - Εκτιμά ότι η Ρωσία θα είναι έτοιμη για πιθανή επίθεση

ΟΙΚΟΝΟΜΙΑ

Πλήρη εξοπλισμό διέταξε ο αρχηγός του γερμανικού στρατού μέχρι το 2029 - Εκτιμά ότι η Ρωσία θα είναι έτοιμη για πιθανή επίθεση

Έρχεται ειδικό τέλος στις αγορές από TEMU και SHEIN: Χρέωση 50 λεπτών στα μικροδέματα και

ΟΙΚΟΝΟΜΙΑ

Έρχεται ειδικό τέλος στις αγορές από TEMU και SHEIN: Χρέωση 50 λεπτών στα μικροδέματα και

Βρετανία: Κρατικοποιείται η σιδηροδρομική εταιρεία South Western Railway

ΕΠΙΧEIΡΗΣΕΙΣ

Βρετανία: Κρατικοποιείται η σιδηροδρομική εταιρεία South Western Railway

Σύσκεψη Μητσοτάκη με Παπαστεργίου και Χρυσοχοΐδη για τον προσωπικό αριθμό πολίτη τη Δευτέρα

ΕΠΙΧEIΡΗΣΕΙΣ

Σύσκεψη Μητσοτάκη με Παπαστεργίου και Χρυσοχοΐδη για τον προσωπικό αριθμό πολίτη τη Δευτέρα

Ο καναδικός γίγαντας CDPQ επενδύει 9,5 δισ. στη Βρετανία

ΕΠΙΧEIΡΗΣΕΙΣ

Ο καναδικός γίγαντας CDPQ επενδύει 9,5 δισ. στη Βρετανία

Αμβούργο: 17 οι τραυματίες από την επίθεση με μαχαίρι στον σιδηροδρομικό σταθμό - Συνελήφθη 39χρονη

ΚΟΙΝΩΝΙΚΑ

Αμβούργο: 17 οι τραυματίες από την επίθεση με μαχαίρι στον σιδηροδρομικό σταθμό - Συνελήφθη 39χρονη

Final Four 2025: Η ημέρα και η ώρα του μεγάλου και του μικρού τελικού της Euroleague

ΚΟΙΝΩΝΙΚΑ

Final Four 2025: Η ημέρα και η ώρα του μεγάλου και του μικρού τελικού της Euroleague

Μίλτος Τεντόγλου: Δυναμική πρεμιέρα στον ανοιχτό, 8,27 μ. στο μίτινγκ της Λεμεσού

ΚΟΙΝΩΝΙΚΑ

Μίλτος Τεντόγλου: Δυναμική πρεμιέρα στον ανοιχτό, 8,27 μ. στο μίτινγκ της Λεμεσού

Ισραηλινά πλήγματα στη Γάζα σκότωσαν συνεργάτες του Ερυθρού Σταυρού

Διεθνη

Ισραηλινά πλήγματα στη Γάζα σκότωσαν συνεργάτες του Ερυθρού Σταυρού

Γερμανία: Πλήρης εξοπλισμός του στρατού έως το 2029 λόγω Ρωσίας

Διεθνη

Γερμανία: Πλήρης εξοπλισμός του στρατού έως το 2029 λόγω Ρωσίας

Ισραηλινά πλήγματα στη Γάζα σκότωσαν συνεργάτες του Ερυθρού Σταυρού

Διεθνη

Ισραηλινά πλήγματα στη Γάζα σκότωσαν συνεργάτες του Ερυθρού Σταυρού

Χρηματιστήριο: Τι οδηγεί τις εισηγμένες στην έξοδο από το ταμπλό

Αγορες Χρημα

Χρηματιστήριο: Τι οδηγεί τις εισηγμένες στην έξοδο από το ταμπλό

Ιταλία: Η Moody’s διατήρησε την αξιολόγηση Baa3, αναβάθμισε το outlook

Αγορες Χρημα

Ιταλία: Η Moody’s διατήρησε την αξιολόγηση Baa3, αναβάθμισε το outlook

Χρηματιστήριο: Τι οδηγεί τις εισηγμένες στην έξοδο από το ταμπλό

Αγορες Χρημα

Χρηματιστήριο: Τι οδηγεί τις εισηγμένες στην έξοδο από το ταμπλό

Επικοινωνία φον ντερ Λάιεν - Τραμπ: Η ΕΕ ζητά προθεσμία ως τις 9 Ιουλίου για «καλή συμφωνία»

Καθημερινα

Επικοινωνία φον ντερ Λάιεν - Τραμπ: Η ΕΕ ζητά προθεσμία ως τις 9 Ιουλίου για «καλή συμφωνία»

Final Four 2025: Μήνυμα Φουρνιέ μετά τον «μικρό τελικό» με τον Παναθηναϊκό

Καθημερινα

Final Four 2025: Μήνυμα Φουρνιέ μετά τον «μικρό τελικό» με τον Παναθηναϊκό

Απόκοσμο σκηνικό στην Κρήτη: Αφρικανική σκόνη σκέπασε το νησί (εικόνες)

Καθημερινα

Απόκοσμο σκηνικό στην Κρήτη: Αφρικανική σκόνη σκέπασε το νησί (εικόνες)