04
Wed, Jun
629 New Articles

TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

ΤΕΧΝΟΛΟΓΙΑ
TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

Το ενημερωμένο μοντέλο τεκμηρίωσης (reasoning) R1 της DeepSeek συγκεντρώνει το μεγαλύτερο ενδιαφέρον της κοινότητας της Τεχνητής Νοημοσύνης αυτή την εβδομάδα.

Ωστόσο, το κινεζικό εργαστήριο AI παρουσίασε επίσης μια μικρότερη, «αποσταγμένη» εκδοχή του νέου R1: το DeepSeek-R1-0528-Qwen3-8B, το οποίο –σύμφωνα με την εταιρεία– ξεπερνά σε επιδόσεις άλλα μοντέλα παρόμοιου μεγέθους σε ορισμένα benchmarks.

Το DeepSeek-R1-0528-Qwen3-8B, που βασίζεται στο μοντέλο Qwen3-8B της Alibaba (λανσαρίστηκε τον Μάιο), αποδίδει καλύτερα από το Gemini 2.5 Flash της Google στο AIME 2025, ένα σύνολο απαιτητικών μαθηματικών ερωτήσεων.

Παράλληλα, πλησιάζει τις επιδόσεις του Phi-4 reasoning plus της Microsoft σε άλλο τεστ μαθηματικών δεξιοτήτων, το HMMT.

Τα λεγόμενα distilled models όπως το DeepSeek-R1-0528-Qwen3-8B είναι γενικά λιγότερο ισχυρά από τις πλήρεις εκδόσεις τους, αλλά έχουν το πλεονέκτημα ότι καταναλώνουν σημαντικά λιγότερους πόρους. Σύμφωνα με την πλατφόρμα cloud NodeShift, το Qwen3-8B μπορεί να τρέξει σε μία GPU με 40–80GB RAM (όπως η Nvidia H100), σε αντίθεση με το πλήρες R1 που απαιτεί περίπου δώδεκα GPUs των 80GB.

Η DeepSeek εκπαίδευσε το DeepSeek-R1-0528-Qwen3-8B χρησιμοποιώντας παραγόμενο κείμενο από το νέο R1, το οποίο στη συνέχεια χρησιμοποιήθηκε για τη βελτίωση (fine-tuning) του Qwen3-8B.

Σε αφιερωμένη σελίδα του μοντέλου στην πλατφόρμα Hugging Face, η DeepSeek περιγράφει το μοντέλο ως κατάλληλο «τόσο για ακαδημαϊκή έρευνα πάνω στα μοντέλα τεκμηρίωσης όσο και για βιομηχανική ανάπτυξη που επικεντρώνεται σε μοντέλα μικρής κλίμακας».

Το μοντέλο διατίθεται με την ελεύθερη άδεια MIT, πράγμα που σημαίνει ότι μπορεί να χρησιμοποιηθεί εμπορικά χωρίς περιορισμούς. Ήδη αρκετοί πάροχοι, όπως το LM Studio, προσφέρουν πρόσβαση στο μοντέλο μέσω API.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Χατζηδάκης για Μονή Σινά: Υπάρχει βούληση της αιγυπτιακής κυβέρνησης να αντιμετωπιστεί με έναν θετικό τρόπο το θέμα

Πολιτικη

Χατζηδάκης για Μονή Σινά: Υπάρχει βούληση της αιγυπτιακής κυβέρνησης να αντιμετωπιστεί με έναν θετικό τρόπο το θέμα

Φαραντούρης: Να επανεξετάσει η Κομισιόν το πακέτο των 4 δισ. προς την Αίγυπτο

Πολιτικη

Φαραντούρης: Να επανεξετάσει η Κομισιόν το πακέτο των 4 δισ. προς την Αίγυπτο

Ανησυχητικές εξελίξεις: Προς κύρωση το Τουρκολιβυκό μνημόνιο - Στη Λιβύη σπεύδει ο Γεραπετρίτης

Πολιτικη

Ανησυχητικές εξελίξεις: Προς κύρωση το Τουρκολιβυκό μνημόνιο - Στη Λιβύη σπεύδει ο Γεραπετρίτης

Πράσινη στροφή στον ΟΑΣΘ - Τον Ιούνιο του 2026 καταφθάνουν 50 νέα ηλεκτρικά λεωφορεία

ΟΙΚΟΝΟΜΙΑ

Πράσινη στροφή στον ΟΑΣΘ - Τον Ιούνιο του 2026 καταφθάνουν 50 νέα ηλεκτρικά λεωφορεία

Ρεκόρ προσλήψεων: Πάνω από 1.000.000 νέες θέσεις εργασίας δημιουργήθηκαν το 1ο τετράμηνο του έτους

ΟΙΚΟΝΟΜΙΑ

Ρεκόρ προσλήψεων: Πάνω από 1.000.000 νέες θέσεις εργασίας δημιουργήθηκαν το 1ο τετράμηνο του έτους

Θετική αξιολόγηση για το ελληνικό Μεσοπρόθεσμο

ΟΙΚΟΝΟΜΙΑ

Θετική αξιολόγηση για το ελληνικό Μεσοπρόθεσμο

Ποζρικίδης: Επικεφαλής της CEFA για τρίτη θητεία ο CEO της ΔΕΘ

ΕΠΙΧEIΡΗΣΕΙΣ

Ποζρικίδης: Επικεφαλής της CEFA για τρίτη θητεία ο CEO της ΔΕΘ

Διάκριση για το efood local στα ΕΒΓΕ 2025

ΕΠΙΧEIΡΗΣΕΙΣ

Διάκριση για το efood local στα ΕΒΓΕ 2025

Μαρινάκης: Η ουσία δεν είναι να κάτσουν στο ίδιο τραπέζι, η ουσία είναι να προσέλθουν Γιαννακόπουλος

ΕΠΙΧEIΡΗΣΕΙΣ

Μαρινάκης: Η ουσία δεν είναι να κάτσουν στο ίδιο τραπέζι, η ουσία είναι να προσέλθουν Γιαννακόπουλος

Ανοδικό το πρώτο τετράμηνο του 2025 για την Αγγελάκης ΑΕ

ΚΟΙΝΩΝΙΚΑ

Ανοδικό το πρώτο τετράμηνο του 2025 για την Αγγελάκης ΑΕ

Ανακοινώθηκε μεγάλη αλλαγή στα παραπεμπτικά εξετάσεων του ΕΟΠΥΥ

ΚΟΙΝΩΝΙΚΑ

Ανακοινώθηκε μεγάλη αλλαγή στα παραπεμπτικά εξετάσεων του ΕΟΠΥΥ

ΑΔΕΔΥ: Πανελλαδική στάση εργασίας την Παρασκευή 6/6 - Τι ισχύει για τις Πανελλήνιες 2025

ΚΟΙΝΩΝΙΚΑ

ΑΔΕΔΥ: Πανελλαδική στάση εργασίας την Παρασκευή 6/6 - Τι ισχύει για τις Πανελλήνιες 2025

Γερμανία: Βρέθηκαν βόμβες του Β' ΠΠ, εκκενώθηκε το κέντρο της Κολωνίας

Διεθνη

Γερμανία: Βρέθηκαν βόμβες του Β' ΠΠ, εκκενώθηκε το κέντρο της Κολωνίας

ΗΠΑ: Σε χαμηλό 2ετίας οι νέες θέσεις εργασίας τον Μάιο

Διεθνη

ΗΠΑ: Σε χαμηλό 2ετίας οι νέες θέσεις εργασίας τον Μάιο

Εκατοντάδες Airbus εξετάζει να παραγγείλει η Κίνα

Διεθνη

Εκατοντάδες Airbus εξετάζει να παραγγείλει η Κίνα

ΟΔΔΗΧ: Στο 1,84% υποχώρησε η απόδοση των εντόκων έτους

Αγορες Χρημα

ΟΔΔΗΧ: Στο 1,84% υποχώρησε η απόδοση των εντόκων έτους

Το ευρώ ενισχύεται 0,20% στα 1,1396 δολάρια

Αγορες Χρημα

Το ευρώ ενισχύεται 0,20% στα 1,1396 δολάρια

Χρηματιστήριο: Βγάζει αντίδραση στο ίδιο κύμα με την Ευρώπη

Αγορες Χρημα

Χρηματιστήριο: Βγάζει αντίδραση στο ίδιο κύμα με την Ευρώπη

Πάρος: Εισροή υδάτων σε σκάφος με 7 επιβαίνοντες

Καθημερινα

Πάρος: Εισροή υδάτων σε σκάφος με 7 επιβαίνοντες

Flip.gr: Πάνω από 21.000 πελάτες και 7,5 εκατ. ευρώ τζίρος μέσα σε σχεδόν δύο χρόνια παρουσίας στην ελληνική αγορά

Καθημερινα

Flip.gr: Πάνω από 21.000 πελάτες και 7,5 εκατ. ευρώ τζίρος μέσα σε σχεδόν δύο χρόνια παρουσίας στην ελληνική αγορά

Πότε χρειάζεται γενετικός έλεγχος για καρκίνο του μαστού;

Καθημερινα

Πότε χρειάζεται γενετικός έλεγχος για καρκίνο του μαστού;