fbpx

Ήλθε το Sora – Νέο εργαλείο Τεχνητής Νοημοσύνης

Η OpenAI προειδοποίησε ότι το «σημερινό μοντέλο» της πλατφόρμας παρουσιάζει «ελαττώματα», καθώς συγχέει το αριστερά με το δεξιά και εμφανίζει αδυναμία να διατηρήσει οπτική συνέχεια σε ολόκληρο το βίντεο.

Χρόνος ανάγνωσης 2 λεπτά
Χρόνος ανάγνωσης 2 λεπτά

Δείτε επίσης

Η OpenAI, δημιουργός του ChatGPT και του δημιουργού εικόνων DALL-E, παρουσίασε νέο εργαλείο με την ονομασία «Sora», ικανό να δημιουργεί – με την απλή εισαγωγή κειμένου – ρεαλιστικά βίντεο διάρκειας έως ενός λεπτού, μείζων καινοτομία στον τομέα της Τεχνητής Νοημοσύνης.

Βασισμένη στις προηγούμενες έρευνες για τα προγράμματα DALL-E και GPT, η νέα πλατφόρμα είναι ακόμη υπό δοκιμή, όπως διευκρίνισε η Καλιφορνέζικη νεοφυής σύμμαχος της Microsoft. Παρουσίασε πάντως βίντεο και τον τρόπο με τον οποίο δημιουργήθηκαν.

Το πρόγραμμα μπορεί να γεννήσει βίντεο «διατηρώντας οπτική ποιότητα και σεβόμενο το αίτημα του χρήστη», ανέφερε στον ιστότοπό της η OpenAI. Το Sora είναι σε θέση «να δημιουργεί πολύπλοκες σκηνές με πολλά πρόσωπα, συγκεκριμένους τύπους κινήσεων και ακριβείς λεπτομέρειες», αναφέρει στον ιστότοπό της η start-up. Επιτρέπει επίσης να δημιουργηθεί βίντεο από μια σταθερή εικόνα ή και να επιμηκυνθεί υφιστάμενο βίντεο.

Ο Σαμ Άλτμαν, ο επικεφαλής της OpenAI, δήλωσε στο μέσο κοινωνικής δικτύωσης X πως η εταιρεία του «θα προσφέρει σε περιορισμένο αριθμό δημιουργών την πρόσβαση» σ’ αυτό το νέο εργαλείο, στο πλαίσιο πειραματικής φάσης.

Ο Σαμ Άλτμαν, ο επικεφαλής της OpenAI, δήλωσε στο μέσο κοινωνικής δικτύωσης X πως η εταιρεία του «θα προσφέρει σε περιορισμένο αριθμό δημιουργών την πρόσβαση» σ’ αυτό το νέο εργαλείο, στο πλαίσιο πειραματικής φάσης. Ο ίδιος κάλεσε επίσης τους χρήστες να κάνουν προτάσεις για τη δημιουργία βίντεο και μερικά λεπτά αργότερα ανέβασε στην πλατφόρμα τα πιο επιτυχημένα απ’ αυτά.

Ανάμεσα τους, βλέπει κανείς δύο σκύλους να παίζουν στο χιόνι σε βουνό. Άλλο βίντεο δείχνει την πτήση ενός φανταστικού ζώου, μισό πάπια μισό δράκος, μπροστά σε ένα υπέροχο ηλιοβασίλεμα, έχοντας στην πλάτη του ένα χάμστερ με εκδρομική περιβολή.

Το Sora χρησιμεύει ως βάση για «προγράμματα ικανά να καταλάβουν και να προσομοιώσουν τον πραγματικό κόσμο», εξηγεί η start up, η οποία ελπίζει ότι «θα αποτελέσει σημαντικό σταθμό στην πραγματοποίηση της AGI», της Γενικής Τεχνητής Νοημοσύνης, πολύ αυτόνομου συστήματος που φέρεται ότι θα ξεπεράσει τους ανθρωπους στις περισσότερες από τις οικονομικά αποδοτικές δουλειές.

Η OpenAI προειδοποίησε ότι το «σημερινό μοντέλο» της πλατφόρμας παρουσιάζει «ελαττώματα», καθώς συγχέει το αριστερά με το δεξιά και εμφανίζει αδυναμία να διατηρήσει οπτική συνέχεια σε ολόκληρο το βίντεο. «Για παράδειγμα, ένα πρόσωπο μπορεί να δαγκώσει ένα μπισκότο, όμως μετά το μπισκότο μπορεί να μην έχει ίχνη από το δάγκωμα», εξηγεί η εταιρεία.

Παρουσιάζοντας αυτό το νέο εργαλείο, η OpenAI ανέφερε πως το ζήτημα της ασφάλειας αποτελεί ουσιώδες διακύβευμα και ότι προσομοιώσεις θα οργανωθούν με χρήστες από τους οποίους θα ζητηθεί να παραγάγουν δυσλειτουργίες ή να δημιουργήσουν ανάρμοστα περιεχόμενα, ώστε να καθορισθούν καλύτερα τα όρια της πλατφόρμας.

«Θα καλέσουμε πρόσωπα που λαμβάνουν πολιτικές αποφάσεις, εκπαιδευτικούς και καλλιτέχνες απ’ όλο τον κόσμο για να κατανοήσουμε τις ανησυχίες τους και να εντοπίσουμε τις θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας», ανέφερε η OpenAI. Οι Meta, Google και Runway AI, οι οποίες εργάζονται σε παρόμοιες εφαρμογές μετατροπής κειμένου σε βίντεο, τις λεγόμενες «text-to-video» («από κείμενο σε βίντεο»), έχουν ήδη παρουσιάσει δείγματα.

- Διαφήμιση -

- Διαφήμιση -

Πρόσφατες αναρτήσεις

- Διαφήμιση -