Anthropic: Λανσάρει το ισχυρότερο μοντέλο Τεχνητής Νοημοσύνης
Δύο νέα μοντέλα Τεχνητής Νοημοσύνης, τα Claude Opus 4 και Claude Sonnet 4, παρουσίασε η Anthropic στο εναρκτήριο συνέδριο προγραμματιστών, επιδιώκοντας να ανεβάσει τον πήχη στην αγορά των δημιουργικών μοντέλων.
Σύμφωνα με την εταιρεία, και τα δύο μοντέλα της νέας οικογένειας Claude 4 συγκαταλέγονται στα πιο αποδοτικά του κλάδου, ειδικά όσον αφορά την επίδοση σε καθιερωμένα benchmarks.
Τα νέα Claude έχουν σχεδιαστεί για να διαχειρίζονται μεγάλα σύνολα δεδομένων, να εκτελούν εργασίες με μακροπρόθεσμο ορίζοντα και να αναλαμβάνουν σύνθετες διεργασίες. Η Anthropic υποστηρίζει πως είναι ιδιαίτερα ικανά στην παραγωγή και την επιμέλεια κώδικα, χάρη στη βελτιωμένη απόδοσή τους σε εργασίες προγραμματισμού.
Το Sonnet 4 θα είναι διαθέσιμο σε όλους τους χρήστες των chatbot εφαρμογών της εταιρείας - επί πληρωμή ή δωρεάν - ενώ το Opus 4 προορίζεται αποκλειστικά για τους συνδρομητές.
Στο API της Anthropic, μέσω των πλατφορμών Bedrock της Amazon και Vertex AI της Google, η χρέωση για το Opus 4 διαμορφώνεται στα 15 δολάρια ανά εκατομμύριο tokens εισόδου και 75 δολάρια ανά εκατομμύριο tokens εξόδου.
Αντίστοιχα, το Sonnet 4 κοστολογείται στα 3 και 15 δολάρια, αντίστοιχα. Για να γίνει αντιληπτό το μέγεθος, ένα εκατομμύριο tokens αντιστοιχούν σε περίπου 750.000 λέξεις - πολύ περισσότερες από το σύνολο του μυθιστορήματος «Πόλεμος και Ειρήνη».
Η παρουσίαση των Claude 4 έρχεται σε μια περίοδο όπου η Anthropic εντείνει τις προσπάθειες εμπορικής επέκτασης. Η εταιρεία, που ιδρύθηκε από πρώην ερευνητές της OpenAI, φιλοδοξεί να φτάσει τα 12 δισ. δολάρια σε έσοδα έως το 2027, από τα 2,2 δισ. που αναμένονται φέτος. Ήδη έχει εξασφαλίσει γραμμή πίστωσης 2,5 δισ. και επενδύσεις δισ. από την Amazon και άλλους, προκειμένου να καλύψει το αυξανόμενο κόστος για την ανάπτυξη μοντέλων αιχμής.
Ο ανταγωνισμός, ωστόσο, παραμένει σκληρός. Παρά το πρόσφατο λανσάρισμα του Claude Sonnet 3.7 και του εργαλείου Claude Code, οι εταιρείες OpenAI και Google έχουν ρίξει στη μάχη δικά τους πανίσχυρα μοντέλα και εργαλεία. Έτσι, η Anthropic επανέρχεται με ισχυρότερες εκδόσεις του Claude, επιχειρώντας να διατηρήσει προβάδισμα στην ταχέως εξελισσόμενη αγορά.
Το Opus 4, το πιο προηγμένο από τα δύο νέα μοντέλα, φέρεται να διαχειρίζεται «πολυβήματες» ροές εργασιών με εντυπωσιακή συνέπεια. Το Sonnet 4, που διαδέχεται το Sonnet 3.7, εμφανίζει βελτιώσεις στον προγραμματισμό, τα μαθηματικά και την ακρίβεια στην εκτέλεση οδηγιών.
Η εταιρεία τονίζει επίσης πως η οικογένεια Claude 4 έχει μειωμένες πιθανότητες να εμφανίσει συμπεριφορές «reward hacking» - στρατηγικές όπου τα μοντέλα εκμεταλλεύονται παραθυράκια για να ολοκληρώσουν εργασίες χωρίς πραγματική κατανόηση.
Παρά τις σημαντικές βελτιώσεις, τα νέα μοντέλα δεν υπερέχουν σε όλα τα benchmarks. Αν και το Opus 4 ξεπερνά τα Gemini 2.5 Pro της Google και GPT-4.1 της OpenAI στο SWE-bench Verified (που αξιολογεί ικανότητες προγραμματισμού), υπολείπεται του o3 της OpenAI σε πολυτροπικά τεστ όπως το MMMU και σε απαιτητικά γνωστικά πεδία όπως η βιολογία και η φυσική, σε επίπεδο διδακτορικού.
Content Original Link:
" target="_blank">