29
Thu, May
412 New Articles

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

ΤΕΧΝΟΛΟΓΙΑ
Παραβίαση ηθικών φραγμών σε AI chatbots: Έρευνα αποκαλύπτει σοβαρά κενά

Μια πρόσφατη μελέτη από το Πανεπιστήμιο Ben Gurion του Ισραήλ αποκάλυψε ότι τα περισσότερα μεγάλα γλωσσικά μοντέλα (LLMs), όπως τα ChatGPT, Gemini και Claude, μπορούν να παρακαμφθούν με ειδικά διαμορφωμένες εντολές, επιτρέποντάς τους να παρέχουν οδηγίες για παράνομες και επικίνδυνες δραστηριότητες, όπως το hacking και η παρασκευή ναρκωτικών, σύμφωνα με τον Guardian

Οι ερευνητές ανέπτυξαν μια «καθολική μέθοδο παράκαμψης» που λειτουργεί σε πολλαπλές πλατφόρμες, αποκαλύπτοντας ότι τα συστήματα αυτά μπορούν να παραδώσουν λεπτομερείς και πρακτικές οδηγίες για παράνομες ενέργειες όταν τους παρουσιαστούν σενάρια που φαίνονται αθώα, όπως η συγγραφή σεναρίων ή η λογοτεχνική φαντασία.

Το πρόβλημα εντείνεται από την ύπαρξη των λεγόμενων «σκοτεινών LLMs», μοντέλων που έχουν σχεδιαστεί χωρίς ηθικούς φραγμούς και διαφημίζονται ως πρόθυμα να βοηθήσουν σε ψηφιακά εγκλήματα και απάτες.

Παρά τις προσπάθειες των εταιρειών να αφαιρέσουν επιβλαβές περιεχόμενο από τα δεδομένα εκπαίδευσης και να εφαρμόσουν αυστηρούς κανόνες, οι ερευνητές διαπίστωσαν ότι οι μηχανισμοί ασφαλείας είναι ευάλωτοι σε παρακάμψεις. Η βασική αδυναμία έγκειται στην τάση των AI να είναι «βοηθητικά», καθιστώντας τα επιρρεπή σε χειρισμούς μέσω κατάλληλων εντολών.

Οι ερευνητές προτείνουν την ενίσχυση των μηχανισμών ασφαλείας μέσω καλύτερης επιλογής δεδομένων εκπαίδευσης, ανάπτυξης τεχνικών «απομάθησης» για την αφαίρεση ευαίσθητων πληροφοριών και την εφαρμογή αυστηρότερων κανονισμών για την ευθύνη των παρόχων LLMs.

Επιπλέον, τονίζουν την ανάγκη για ανεξάρτητη εποπτεία και σαφέστερα πρότυπα ασφαλείας, σύμφωνα με το Digital Watch Observatory

Η μελέτη υπογραμμίζει την επείγουσα ανάγκη για αυξημένη προσοχή και δράση από τις εταιρείες τεχνολογίας και τις ρυθμιστικές αρχές, προκειμένου να διασφαλιστεί ότι τα AI συστήματα δε θα χρησιμοποιούνται για επιβλαβείς σκοπούς.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Χατζηδάκης για ένταξη Ελλάδας στην ΕΟΚ: "Η ιστορία δικαίωσε τον Καραμανλή και μαζί του τη Νέα Δημοκρατία"

Πολιτικη

Χατζηδάκης για ένταξη Ελλάδας στην ΕΟΚ: "Η ιστορία δικαίωσε τον Καραμανλή και μαζί του τη Νέα Δημοκρατία"

Μώραλης στα Παραπολιτικά 90,1: "Η λογική είναι να μάθουμε να ανακυκλώνουμε και να έχει μια ανταποδοτικότητα"

Πολιτικη

Μώραλης στα Παραπολιτικά 90,1: "Η λογική είναι να μάθουμε να ανακυκλώνουμε και να έχει μια ανταποδοτικότητα"

Δήμαρχοι στο e-ota.gr: Κρίσιμο ζήτημα η προστασία του Περιβάλλοντος

Πολιτικη

Δήμαρχοι στο e-ota.gr: Κρίσιμο ζήτημα η προστασία του Περιβάλλοντος

Καραμπόλα τριών οχημάτων στην Περιφερειακή Υμηττού

ΟΙΚΟΝΟΜΙΑ

Καραμπόλα τριών οχημάτων στην Περιφερειακή Υμηττού

Νέο ΔΕΗ Mini Park στον Δήμο Κηφισιάς - Νέας Ερυθραίας

ΟΙΚΟΝΟΜΙΑ

Νέο ΔΕΗ Mini Park στον Δήμο Κηφισιάς - Νέας Ερυθραίας

Πιερρακάκης για Alpha Bank – Unicredit: Aπόδειξη της έμπρακτης εμπιστοσύνης στην ελληνική οικονομία

ΟΙΚΟΝΟΜΙΑ

Πιερρακάκης για Alpha Bank – Unicredit: Aπόδειξη της έμπρακτης εμπιστοσύνης στην ελληνική οικονομία

Μητσοτάκης στο υπουργικό: Εθνική Αρχή κατά της Ακρίβειας στα πρότυπα της Σουηδίας

ΕΠΙΧEIΡΗΣΕΙΣ

Μητσοτάκης στο υπουργικό: Εθνική Αρχή κατά της Ακρίβειας στα πρότυπα της Σουηδίας

ΕΛΣΤΑΤ: Αύξηση 7,5% στον τζίρο των επιχειρήσεων σε καταλύματα το πρώτο τρίμηνο του 2025

ΕΠΙΧEIΡΗΣΕΙΣ

ΕΛΣΤΑΤ: Αύξηση 7,5% στον τζίρο των επιχειρήσεων σε καταλύματα το πρώτο τρίμηνο του 2025

Alpha Trust – Ανδρομέδα: Στα 6,59 ευρώ η τιμή διάθεσης των νέων μετοχών

ΕΠΙΧEIΡΗΣΕΙΣ

Alpha Trust – Ανδρομέδα: Στα 6,59 ευρώ η τιμή διάθεσης των νέων μετοχών

Ο διάδοχος του Ολυμπιακού με σούπερ απόδοση στην Interwetten!

ΚΟΙΝΩΝΙΚΑ

Ο διάδοχος του Ολυμπιακού με σούπερ απόδοση στην Interwetten!

Φορολοταρία Απριλίου: Έγινε η κλήρωση, δείτε αν κερδίσατε 50.000 ευρώ

ΚΟΙΝΩΝΙΚΑ

Φορολοταρία Απριλίου: Έγινε η κλήρωση, δείτε αν κερδίσατε 50.000 ευρώ

Τα «κουκιά» της Προανακριτικής - Τι φοβάται το Μαξίμου

ΚΟΙΝΩΝΙΚΑ

Τα «κουκιά» της Προανακριτικής - Τι φοβάται το Μαξίμου

ILO: Λιγότερες θέσεις εργασίας λόγω οικονομικής επιβράδυνσης

Διεθνη

ILO: Λιγότερες θέσεις εργασίας λόγω οικονομικής επιβράδυνσης

Ρωγμές στο πολωνικό «θαύμα» πριν την εκλογική αναμέτρηση

Διεθνη

Ρωγμές στο πολωνικό «θαύμα» πριν την εκλογική αναμέτρηση

Η Τσεχία κατηγορεί την Κίνα για κυβερνοεπίθεση στο ΥΠΕΞ της

Διεθνη

Η Τσεχία κατηγορεί την Κίνα για κυβερνοεπίθεση στο ΥΠΕΞ της

Εξάμηνα έντοκα γραμμάτια: Στο 1,74% υποχώρησε η απόδοση

Αγορες Χρημα

Εξάμηνα έντοκα γραμμάτια: Στο 1,74% υποχώρησε η απόδοση

Τραπεζικό ράλι στο Χρηματιστήριο, κέρδη άνω του 6% για Alpha

Αγορες Χρημα

Τραπεζικό ράλι στο Χρηματιστήριο, κέρδη άνω του 6% για Alpha

Ήπια ανοδική κίνηση στα ευρωπαϊκά χρηματιστήρια, νέο ρεκόρ Dax

Αγορες Χρημα

Ήπια ανοδική κίνηση στα ευρωπαϊκά χρηματιστήρια, νέο ρεκόρ Dax

UniCredit to Become Major Shareholder in Alpha Bank After Reggeborgh Exit

Καθημερινα

UniCredit to Become Major Shareholder in Alpha Bank After Reggeborgh Exit

Μείωση στην οικοδομική δραστηριότητα κατά το δίμηνο Ιανουαρίου - Φεβρουαρίου 2025

Καθημερινα

Μείωση στην οικοδομική δραστηριότητα κατά το δίμηνο Ιανουαρίου - Φεβρουαρίου 2025

Άμεσες προσλήψεις ζητούν οι νοσοκομειακοί γιατροί

Καθημερινα

Άμεσες προσλήψεις ζητούν οι νοσοκομειακοί γιατροί