OpenAI: Λανσάρει έναν γενικής χρήσης AI agent στο ChatGPT
Η OpenAI λανσάρει έναν νέο γενικού σκοπού agent Τεχνητής Νοημοσύνης στο ChatGPT, ο οποίος – σύμφωνα με την εταιρεία – μπορεί να ολοκληρώνει ένα ευρύ φάσμα υπολογιστικών εργασιών για λογαριασμό των χρηστών. Η OpenAI αναφέρει ότι ο πράκτορας μπορεί να περιηγείται αυτόματα στο ημερολόγιο του χρήστη, να δημιουργεί επεξεργάσιμες παρουσιάσεις και διαφάνειες αλλά και να εκτελεί κώδικα.
Το εργαλείο, που ονομάζεται ChatGPT agent, συνδυάζει διάφορες δυνατότητες από προηγούμενα agentic εργαλεία της OpenAI, συμπεριλαμβανομένης της δυνατότητας του Operator να «κλικάρει» σε ιστοσελίδες, καθώς και της δυνατότητας του Deep Research να συνθέτει πληροφορίες από δεκάδες ιστοσελίδες σε μια περιεκτική ερευνητική αναφορά. Η OpenAI αναφέρει ότι οι χρήστες θα μπορούν να αλληλεπιδρούν με τον πράκτορα απλώς με φυσική γλώσσα, μέσα από το ChatGPT.
Ο ChatGPT agent ξεκινά να διατίθεται την Πέμπτη σε συνδρομητές των προγραμμάτων Pro, Plus και Team. Για να ενεργοποιηθεί το εργαλείο, οι χρήστες μπορούν να επιλέξουν τη λειτουργία «agent mode» από το μενού του ChatGPT.
Η κυκλοφορία του ChatGPT agent αποτελεί την πιο τολμηρή προσπάθεια της OpenAI μέχρι σήμερα να μετατρέψει το ChatGPT σε ένα προϊόν που μπορεί να εκτελεί ενέργειες και να αναλαμβάνει εργασίες για τους χρήστες, αντί απλώς να απαντά σε ερωτήσεις. Τα τελευταία χρόνια, εταιρείες της Silicon Valley όπως η OpenAI, η Google και η Perplexity έχουν παρουσιάσει δεκάδες AI agents με παρόμοιες υποσχέσεις. Ωστόσο, οι πρώιμες εκδόσεις αυτών των πρακτόρων δυσκολεύτηκαν με πολύπλοκες εργασίες και δεν αποδείχθηκαν ιδιαίτερα ελκυστικά προϊόντα σε σχέση με το όραμα που παρουσίαζαν οι τεχνολογικοί ηγέτες.
Παρόλα αυτά, η OpenAI υποστηρίζει ότι αυτό το σύστημα είναι πολύ πιο ικανό από προηγούμενα που έχει προτείνει.
Ο νέος ψηφιακός βοηθός μπορεί να έχει πρόσβαση σε ChatGPT connectors, επιτρέποντας στους χρήστες να συνδέσουν εφαρμογές όπως το Gmail και το GitHub, ώστε ο πράκτορας να βρίσκει σχετικές πληροφορίες για τα αιτήματα του χρήστη. Η OpenAI αναφέρει επίσης ότι ο πράκτορας έχει πρόσβαση σε τερματικό, και μπορεί να χρησιμοποιεί APIs για να αλληλεπιδρά με ορισμένες εφαρμογές.
Η OpenAI προτείνει παραδείγματα χρήσης όπως το να «σχεδιάσει και να αγοράσει υλικά για ιαπωνικό πρωινό για τέσσερα άτομα» ή να «αναλύσει τρεις ανταγωνιστές και να δημιουργήσει ένα slide deck». Αυτές οι δυνατότητες απαιτούν από τον ΑΙ agent να περιηγηθεί σε ιστοσελίδες, να σχεδιάσει μια πορεία δράσης και να χρησιμοποιήσει εργαλεία — δηλαδή πολύ πιο σύνθετες ενέργειες από όσες έχει προσπαθήσει να υλοποιήσει στο παρελθόν η OpenAI.
Το μοντέλο που υποστηρίζει τον ChatGPT agent προσφέρει state-of-the-art απόδοση σε διάφορα benchmarks, σύμφωνα με την OpenAI.
Η εταιρεία αναφέρει ότι το μοντέλο του ChatGPT agent πετυχαίνει 41,6% στο «Humanity’s Last Exam», μια δύσκολη δοκιμασία με χιλιάδες ερωτήσεις από περισσότερα από εκατό θέματα. Αυτό είναι περίπου διπλάσιο σκορ σε σχέση με τα μοντέλα o3 και o4-mini της OpenAI.
Στο FrontierMath, ένα από τα πιο δύσκολα γνωστά benchmarks για μαθηματικά, η OpenAI αναφέρει ότι ο ChatGPT agent πετυχαίνει 27,4% όταν έχει πρόσβαση σε εργαλεία όπως το τερματικό. Η προηγούμενη κορυφαία επίδοση ήταν μόλις 6,3% από το o4-mini.
Ακόμη, η εταιρεία σημειώνει ότι ανέπτυξε τον ChatGPT agent με έμφαση στην ασφάλεια, λόγω των νέων ικανοτήτων που ενδέχεται να τον καταστήσουν πιο επικίνδυνο στα χέρια κακόβουλων χρηστών. Η OpenAI έχει ήδη προειδοποιήσει ότι τα agentic μοντέλα μπορεί να παρουσιάσουν επικίνδυνες δυνατότητες.
Στην έκθεση ασφάλειας για τον πράκτορα ChatGPT, η OpenAI δηλώνει ότι έχει χαρακτηρίσει το μοντέλο ως “υψηλής ικανότητας” σε βιολογικά και χημικά πεδία όπλων, σύμφωνα με το Preparedness Framework της εταιρείας. Αυτό σημαίνει ότι έχει τη δυνατότητα να ενισχύσει υπάρχουσες οδούς που οδηγούν σε σοβαρή βλάβη. Αν και η OpenAI δηλώνει ότι δεν έχει άμεσες αποδείξεις γι' αυτό, έχει αποφασίσει να ακολουθήσει μια προληπτική προσέγγιση, ενεργοποιώντας νέα μέτρα ασφαλείας.
Τα νέα μέτρα περιλαμβάνουν έναν μηχανισμό παρακολούθησης σε πραγματικό χρόνο καθώς οι χρήστες αλληλεπιδρούν με τον πράκτορα. Η OpenAI αναφέρει ότι εφαρμόζει έναν ταξινομητή (classifier) σε κάθε prompt που εισάγεται, για να εντοπίσει αν σχετίζεται με βιολογία. Αν ναι, τότε το αποτέλεσμα του πράκτορα περνάει από δεύτερο φίλτρο, που εκτιμά αν το περιεχόμενο μπορεί να αποτελέσει βιολογική απειλή.
Η OpenAI αναφέρει επίσης ότι απενεργοποίησε τη λειτουργία μνήμης του ChatGPT για τον πράκτορα, ώστε να αποτραπούν καταχρήσεις. Σε άλλα μέρη του ChatGPT, η μνήμη επιτρέπει στο chatbot να θυμάται πληροφορίες από προηγούμενες συνομιλίες. Ωστόσο, η εταιρεία φοβάται ότι κακόβουλοι χρήστες θα μπορούσαν να εκμεταλλευτούν τη μνήμη για να αποσπάσουν ευαίσθητα δεδομένα μέσω επιθέσεων τύπου prompt injection. Η OpenAI δηλώνει ότι ίσως εξετάσει την επαναφορά αυτής της δυνατότητας στο μέλλον.
Αν και ο ChatGPT agent φαίνεται εντυπωσιακός, μένει να φανεί πόσο ικανός είναι στην πράξη. Μέχρι σήμερα, η τεχνολογία των πρακτόρων AI έχει αποδειχθεί σχετικά εύθραυστη όταν αλληλεπιδρά με τον πραγματικό κόσμο. Ωστόσο, η OpenAI αναφέρει ότι έχει αναπτύξει ένα πολύ πιο ικανό μοντέλο, το οποίο μπορεί να ανταποκριθεί στις προσδοκίες γύρω από την υπόσχεση των AI πρακτόρων.
Content Original Link:
" target="_blank">