Google dirbtinis intelektas nuo siol gali girdeti

„Google“ dirbtinis intelektas nuo šiol gali girdėti

Aistė Varnelytė 2024-04-10

REKLAMA

Dirbtinio intelekto pokalbių robotai jau gali „matyti“ pasaulį per vaizdus ir vaizdo įrašus. Tačiau dabar „Google“ paskelbė, kad naujausiame „Gemini Pro“ atnaujinime įdiegtos garso ir kalbos funkcijos.

Dabar „Gemini 1.5 Pro“ pokalbių robotas gali „išgirsti“ į jo sistemą įkeltus garso failus ir tada išgauti tekstinę informaciją.

Bendrovė šią LLM versiją pateikė kaip viešą išankstinę peržiūrą savo „Vertex AI“ kūrimo platformoje.

REKLAMA

Tai leis daugiau į įmones orientuotų naudotojų eksperimentuoti su šia funkcija ir praplėsti jos bazę po labiau privataus diegimo vasario mėnesį, kai apie modelį buvo paskelbta pirmą kartą. Iš pradžių jis buvo siūlomas tik ribotai kūrėjų ir įmonių klientų grupei.

1. Breaking down + understanding a long video

I uploaded the entire NBA dunk contest from last night and asked which dunk had the highest score.

Gemini 1.5 was incredibly able to find the specific perfect 50 dunk and details from just its long context video understanding! pic.twitter.com/01iUfqfiAO

— Rowan Cheung (@rowancheung) February 18, 2024

Galingiausias „Google“ generatyvinis DI modelis

„Google“ išsamia informacija apie atnaujinimą pasidalijo Las Vegase vykstančioje konferencijoje „Cloud Next“.

Galingiausiu „Gemini“ šeimos modeliu pavadinusi „Gemini Ultra LLM“, kuriuo valdomas „Gemini Advanced“ pokalbių robotas, „Google“ dabar vadina „Gemini 1.5 Pro“ savo galingiausiu generatyviniu modeliu.

Kompanija pridūrė, kad ši dirbtinio intelekto versija geriau mokosi be papildomo modelio derinimo.

REKLAMA

„Gemini 1.5 Pro“ yra multimodalinis, nes gali interpretuoti įvairių tipų garso įrašus į tekstą, įskaitant televizijos laidas, filmus, radijo laidas ir konferencinių pokalbių įrašus.

Jis netgi daugiakalbis, nes gali apdoroti garso įrašus keliomis skirtingomis kalbomis. LLM taip pat gali kurti vaizdo įrašų transkripcijas, tačiau, kaip minėjo „TechCrunch“, jo kokybė gali būti nepatikima.

Kai pirmą kartą buvo paskelbta, „Google“ paaiškino, kad „Gemini 1.5 Pro“ neapdorotiems duomenims apdoroti naudoja ženklų sistemą.

Milijonas ženklų prilygsta maždaug 700 000 žodžių arba 30 000 kodo eilučių. Žiniasklaidos pavidalu tai prilygsta valandai vaizdo įrašo arba maždaug 11 valandų garso įrašo.

„Gemini 1.5 Pro“ demonstracijos

Buvo keletas privačių „Gemini 1.5 Pro“ demonstracinių versijų, kuriose pristatoma, kaip LLM gali rasti konkrečius vaizdo įrašo transkripcijos momentus.

Pavyzdžiui, dirbtinio intelekto entuziastas Rowanas Cheungas gavo išankstinę prieigą ir išsamiai aprašė, kaip jo demonstracinė versija rado tikslų sporto varžybų kadrą ir apibendrino įvykį.

Tačiau „Google“ pažymėjo, kad kiti ankstyvieji naudotojai, įskaitant „United Wholesale Mortgage“, „TBS“ ir „Replit“, renkasi labiau į įmones orientuotus naudojimo atvejus, pavyzdžiui, būsto paskolos draudimą, metaduomenų žymėjimo automatizavimą ir kodo generavimą, aiškinimą ir atnaujinimą.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

ROSVELO ATEIVIO ISTORIJA: KAS NUTIKO 1947-AISIAIS?

„ELEKTROS DIETA“: MASINĖ 1910-ŲJŲ BAIMĖS PSICHOZĖ

KAS IŠRADO ELEKTRĄ? 6 MOKSLININKAI, KURIEMS TURIME BŪTI DĖKINGI

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

Aistė Varnelytė Inovacijų entuziastė ir technologijų žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Lietuviams gerai pažįstamas produktas per 48 valandas sumažino cholesterolį – poveikis išliko savaitėms

NAUJAUSI

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Aistė Varnelytė

Inovacijų entuziastė ir technologijų žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

Kosmosas

Rokas 2026-03-08
Prieš 14 val.
JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Kibernetinis Saugumas

Rokas 2026-03-08
Prieš 11 val.
Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Dirbtinis Intelektas

Rokas 2026-03-06
Prieš 2 d.

LABIAUSIAI ĮTRAUKIANČIOS

Lietuviams gerai pažįstamas produktas per 48 valandas sumažino cholesterolį – poveikis išliko savaitėms

Mokslas Ir It

Agnė 2026-03-03
Prieš 5 d.
Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Gynyba Ir Saugumas

Rokas 2026-03-05
Prieš 3 d.
7 milijonų ląstelių tyrimas atskleidė, kaip iš tikrųjų sensta žmogaus kūnas

Mokslas Ir It

Rokas 2026-03-02
Prieš 6 d.

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.

Dirbtinis Intelektas

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Rokas | 2026-03-08

Išmanieji Įrenginiai

Viskas, ką „Samsung“ pristatė 2026-ųjų „Galaxy Unpacked“ renginyje

Rokas | 2026-03-01

Dirbtinis Intelektas

Nuo šiol su „Gemini“ galėsite kurti muziką: štai kaip išbandyti

Rokas | 2026-02-19

Dirbtinis Intelektas

Programišiai bandė nukopijuoti „Gemini“: įspėjama apie augančią klastočių grėsmę

Rokas | 2026-02-13

Išmanieji Įrenginiai

„Google“ sustabdė slaptą interneto tinklą – apsaugoti milijonai vartotojų įrenginių

Rokas | 2026-01-29

Dirbtinis Intelektas

„Gmail“ sparčiai integruos dirbtinį intelektą: laukia 3 naujienos

Agnė | 2026-01-09

Verslas Ir Technologijos

„Google“ paskelbė, kada geriausia pirkti skrydžių bilietus – ir pateikė netikėtų įžvalgų

Agnė | 2025-12-17

Mokslas ir IT

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Verslas ir technologijos

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Dirbtinis intelektas

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Išmanieji įrenginiai

Ekstremalus „HONOR Magic V6“ testas parodė, kiek iš tikrųjų gali atlaikyti sulankstomas telefonas

Auto / Moto

BYD pristatė elektromobilio bateriją, kuriai įkrauti pakaks vos kelių minučių

Kriptovaliutos

Prieš 14 metų į bitkoiną investavęs 7 tūkst. JAV dolerių, dabar – milijardierius

Kosmosas

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

Kibernetinis saugumas

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Gynyba ir saugumas

Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Vaizdo žaidimai

Startuoja pirmas toks „Minecraft“ serveris Lietuvoje: žaisti kviečia žinomi „YouTube“ kūrėjai

„Google“ dirbtinis intelektas nuo šiol gali girdėti

Galingiausias „Google“ generatyvinis DI modelis

„Gemini 1.5 Pro“ demonstracijos

Kaip vertinate šį straipsnį?

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

ROSVELO ATEIVIO ISTORIJA: KAS NUTIKO 1947-AISIAIS?

„ELEKTROS DIETA“: MASINĖ 1910-ŲJŲ BAIMĖS PSICHOZĖ

KAS IŠRADO ELEKTRĄ? 6 MOKSLININKAI, KURIEMS TURIME BŪTI DĖKINGI

Žymos:

DIENOS SKAITOMIAUSI

NAUJAUSI

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

DIENOS SKAITOMIAUSI

LABIAUSIAI ĮTRAUKIANČIOS

Taip pat skaitykite

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Viskas, ką „Samsung“ pristatė 2026-ųjų „Galaxy Unpacked“ renginyje

Nuo šiol su „Gemini“ galėsite kurti muziką: štai kaip išbandyti

Programišiai bandė nukopijuoti „Gemini“: įspėjama apie augančią klastočių grėsmę

Kaip atsisiųsti „Google Play“ programėlę į telefoną

Kaip pašalinti savo asmeninius duomenis iš „Google“ paieškos

„Google“ dar labiau keis paiešką – informacijos nebeieškosite, jos paklausite

„Google“ sustabdė slaptą interneto tinklą – apsaugoti milijonai vartotojų įrenginių

„Gmail“ sparčiai integruos dirbtinį intelektą: laukia 3 naujienos

„Google“ paskelbė, kada geriausia pirkti skrydžių bilietus – ir pateikė netikėtų įžvalgų

Patikrintos technologijų naujienos iš Lietuvos ir viso pasaulio.