Η OpenAI, δημιουργός του ChatGPT και του εργαλείου δημιουργίας εικόνων DALL-E, παρουσίασε ένα νέο εργαλείο με την ονομασία «Sora», το οποίο είναι ικανό να δημιουργεί, με την απλή εισαγωγή ενός κειμένου, ρεαλιστικά βίντεο που μπορούν να διαρκέσουν έως ένα λεπτό – μια μείζων καινοτομία στον τομέα της τεχνητής νοημοσύνης.
Πώς λειτουργεί το «Sora»
Το πρόγραμμα μπορεί να δημιουργήσει βίντεο μέγιστης διάρκειας ενός λεπτού “διατηρώντας οπτική ποιότητα και σεβόμενο το αίτημα του χρήστη”, ανέφερε στον ιστότοπό της η OpenAI. Το Sora μπορεί “να δημιουργεί πολύπλοκες σκηνές με πολλά πρόσωπα, συγκεκριμένους τύπους κινήσεων και ακριβείς λεπτομέρειες”, αναφέρει στον ιστότοπό της η start-up. Επιπλέον, το Sora επιτρέπει να δημιουργηθεί βίντεο από μια σταθερή εικόνα, διαβεβαιώνοντας ο γίγαντας της τεχνητής νοημοσύνης ή και να επιμηκυνθούν υφιστάμενα βίντεο.
Τι αναφέρει ο Σαμ Αλτμαν
Ο Σαμ Αλτμαν, ο επικεφαλής της OpenAI, δήλωσε στο μέσο κοινωνικής δικτύωσης X πως η εταιρεία του “θα προσφέρει σε περιορισμένο αριθμό δημιουργών την πρόσβαση” σ’ αυτό το νέο εργαλείο, στο πλαίσιο μιας πειραματικής φάσης. Ο ίδιος κάλεσε επίσης τους χρήστες να κάνουν προτάσεις για τη δημιουργία βίντεο και μερικά λεπτά αργότερα ανέβασε στην πλατφόρμα τα πιο επιτυχημένα απ’ αυτά.
here is sora, our video generation model:https://t.co/CDr4DdCrh1
today we are starting red-teaming and offering access to a limited number of creators.@_tim_brooks @billpeeb @model_mechanic are really incredible; amazing work by them and the team.
remarkable moment.
— Sam Altman (@sama) February 15, 2024
Ανάμεσα σ’ αυτά τα βίντεο βλέπει κανείς δύο σκύλους να παίζουν στο χιόνι σε βουνό. Ένα άλλο βίντεο δείχνει την πτήση ενός φανταστικού ζώου, μισό πάπια μισό δράκος, μπροστά σε ένα υπέροχο ηλιοβασίλεμα, έχοντας στην πλάτη του ένα χάμστερ με εκδρομική περιβολή.
Ελαττώματα και ζητήματα ασφαλείας
Η OpenAI προειδοποίησε ότι το “σημερινό μοντέλο” της πλατφόρμας παρουσιάζει “ελαττώματα”, καθώς συγχέει το αριστερά με το δεξιά και εμφανίζει αδυναμία να διατηρήσει μια οπτική συνέχεια σε ολόκληρο το βίντεο. “Για παράδειγμα, ένα πρόσωπο μπορεί να δαγκώσει ένα μπισκότο, όμως μετά το μπισκότο μπορεί να μην έχει ίχνη από το δάγκωμα”, εξηγεί η εταιρεία.
here is a better one: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN
— Sam Altman (@sama) February 15, 2024
Παρουσιάζοντας αυτό το νέο εργαλείο, η OpenAI ανέφερε πως το ζήτημα της ασφάλειας αποτελεί ουσιώδες διακύβευμα και ότι προσομοιώσεις θα οργανωθούν με χρήστες από τους οποίους θα ζητηθεί να παραγάγουν δυσλειτουργίες ή να δημιουργήσουν ανάρμοστα περιεχόμενα, ώστε να καθορισθούν καλύτερα τα όρια της πλατφόρμας. “Θα καλέσουμε πρόσωπα που λαμβάνουν πολιτικές αποφάσεις, εκπαιδευτικούς και καλλιτέχνες απ’ όλο τον κόσμο για να κατανοήσουμε τις ανησυχίες τους και να εντοπίσουμε τις θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας”, ανέφερε η OpenAI. Οι Meta, Google και Runway AI, οι οποίες εργάζονται σε πολύπλοκες εφαρμογές μετατροπής κειμένου σε βίντεο, τις λεγόμενες “text-to-video”, έχουν ήδη παρουσιάσει δείγματα. Πηγή: ΑΠΕ – ΜΠΕ