Жасанды интеллекттегі жаңа төңкеріс: Gemini Omni несімен мықты?
Google жасанды интеллект әлемінде бәсекелестерін шаң қаптыратын жаңа құралын қамдап жатыр.

Google жасанды интеллект әлемінде бәсекелестерін шаң қаптыратын жаңа құралын қамдап жатыр. Ол – мәтін, сурет, аудио және видеоны бір арнаға тоғыстырған «Gemini Omni» нейрожелісі. Бұл жоба әлі ресми таныстырылмаса да, технология саласында үлкен дүмпу туғызып үлгерді. Әсіресе, видеоконтент жасаумен айналысатындар үшін бұл нағыз олжа болмақ.
Жаңа жүйені алғашқылардың қатарында сынап көрген мамандардың сөзінше, бағдарлама жасаған видеоларды кәдімгі камераға түсірілген кадрлардан ажырату мүлдем мүмкін емес. Мәселен, тақта алдында жазу жазып тұрған адамның бейнесі дәл бір жоғары сапалы фильмдегідей шынайы шығады. Оған қоса, нейрожелі адамның жазбаша бұйрығын еш қатесіз, детальдарын қалт жібермей дәлме-дәл орындайды, ал видеодағы дыбыстың сапасы бұрын-соңды болмаған деңгейге көтерілген.
Сарапшылар Gemini Omni жүйесін сегіз қырлы, бір сырлы әмбебап көмекшіге балайды. Өйткені ол тек бір ғана бағытта емес, барлық медиа форматта қатар жұмыс істей береді. Ең басты жаңалық – оның ақпаратты қабылдау ауқымы. Модель бір уақытта 12 миллион токенге дейін өңдей алады деген сөз тарады, яғни оған мейлінше көлемді әрі күрделі тапсырмаларды жүктеуге болады. Бұл қазіргі видео жасайтын Veo 3.1 жүйесін толық алмастыруы немесе онымен қатар жұмыс істеуі де мүмкін.
Дегенмен, қауіпсіздік мәселесі қатаң назарда ұсталған. Жүйенің мүмкіндігі шексіз көрінгенімен, оның ішіне мықты сүзгі орнатылған. Яғни, этикаға жатпайтын, зиянды немесе жағымсыз видеолар жасауға алгоритм қатаң түрде тыйым салады.
Әзірге бұл ақпараттар инсайдерлердің болжамына сүйенгенімен, оның шындыққа айналар күні алыс емес. Өйткені, компания өзінің DeepMind зерттеу орталығы арқылы осы бағытты қарқынды дамытып жатыр. Сапалы, креативті әрі тез контент дайындауды көздейтін жоба авторлары мен ютуберлер үшін бұл алдағы уақытта ең негізгі жұмыс құралына айналуы ғажап емес.











