...
TechNaujienos.lt
No Result
View All Result
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės
No Result
View All Result
TechNaujienos.lt
No Result
View All Result

Pradžia » Naujienos » Gemini 1.5 Pro » „Google“ dirbtinis intelektas nuo šiol gali girdėti

„Google“ dirbtinis intelektas nuo šiol gali girdėti

Parengė Technaujienos.lt
2024-04-10
tema: Dirbtinis intelektas
Google dirbtinis intelektas nuo siol gali girdeti

Dirbtinio intelekto pokalbių robotai jau gali „matyti“ pasaulį per vaizdus ir vaizdo įrašus. Tačiau dabar „Google“ paskelbė, kad naujausiame „Gemini Pro“ atnaujinime įdiegtos garso ir kalbos funkcijos.

Dabar „Gemini 1.5 Pro“ pokalbių robotas gali „išgirsti“ į jo sistemą įkeltus garso failus ir tada išgauti tekstinę informaciją.

Bendrovė šią LLM versiją pateikė kaip viešą išankstinę peržiūrą savo „Vertex AI“ kūrimo platformoje.

Tai leis daugiau į įmones orientuotų naudotojų eksperimentuoti su šia funkcija ir praplėsti jos bazę po labiau privataus diegimo vasario mėnesį, kai apie modelį buvo paskelbta pirmą kartą. Iš pradžių jis buvo siūlomas tik ribotai kūrėjų ir įmonių klientų grupei.

1. Breaking down + understanding a long video

I uploaded the entire NBA dunk contest from last night and asked which dunk had the highest score.

Gemini 1.5 was incredibly able to find the specific perfect 50 dunk and details from just its long context video understanding! pic.twitter.com/01iUfqfiAO

— Rowan Cheung (@rowancheung) February 18, 2024

Galingiausias „Google“ generatyvinis DI modelis

„Google“ išsamia informacija apie atnaujinimą pasidalijo Las Vegase vykstančioje konferencijoje „Cloud Next“.

Galingiausiu „Gemini“ šeimos modeliu pavadinusi „Gemini Ultra LLM“, kuriuo valdomas „Gemini Advanced“ pokalbių robotas, „Google“ dabar vadina „Gemini 1.5 Pro“ savo galingiausiu generatyviniu modeliu.

Kompanija pridūrė, kad ši dirbtinio intelekto versija geriau mokosi be papildomo modelio derinimo.

„Gemini 1.5 Pro“ yra multimodalinis, nes gali interpretuoti įvairių tipų garso įrašus į tekstą, įskaitant televizijos laidas, filmus, radijo laidas ir konferencinių pokalbių įrašus.

Jis netgi daugiakalbis, nes gali apdoroti garso įrašus keliomis skirtingomis kalbomis. LLM taip pat gali kurti vaizdo įrašų transkripcijas, tačiau, kaip minėjo „TechCrunch“, jo kokybė gali būti nepatikima.

Kai pirmą kartą buvo paskelbta, „Google“ paaiškino, kad „Gemini 1.5 Pro“ neapdorotiems duomenims apdoroti naudoja ženklų sistemą.

Milijonas ženklų prilygsta maždaug 700 000 žodžių arba 30 000 kodo eilučių. Žiniasklaidos pavidalu tai prilygsta valandai vaizdo įrašo arba maždaug 11 valandų garso įrašo.

„Gemini 1.5 Pro“ demonstracijos

Buvo keletas privačių „Gemini 1.5 Pro“ demonstracinių versijų, kuriose pristatoma, kaip LLM gali rasti konkrečius vaizdo įrašo transkripcijos momentus.

Pavyzdžiui, dirbtinio intelekto entuziastas Rowanas Cheungas gavo išankstinę prieigą ir išsamiai aprašė, kaip jo demonstracinė versija rado tikslų sporto varžybų kadrą ir apibendrino įvykį.

Tačiau „Google“ pažymėjo, kad kiti ankstyvieji naudotojai, įskaitant „United Wholesale Mortgage“, „TBS“ ir „Replit“, renkasi labiau į įmones orientuotus naudojimo atvejus, pavyzdžiui, būsto paskolos draudimą, metaduomenų žymėjimo automatizavimą ir kodo generavimą, aiškinimą ir atnaujinimą.

Žymos: Gemini 1.5 ProGemini ProGoogle

Toliau skaitykite

HP ir Google meta issuki vaizdo pokalbiams stai kaip atrodys 3D susitikimai

„HP“ ir „Google“ meta iššūkį vaizdo pokalbiams: štai kaip atrodys 3D susitikimai

2025-06-13
Naujas irankis Android naudotojams gali aptikti pasleptas kenkejiskas programas

Naujas įrankis „Android“ naudotojams: gali aptikti paslėptas kenkėjiškas programas

2025-04-07
Google DI verziasi i prieki Gemini interpretuos vaizda realiu laiku kaip tai atrodo

„Google“ DI veržiasi į priekį: Interpretuos turinį jūsų ekrane realiu laiku – kaip tai veikia?

2025-03-24

Naujausios

M. Zuckerbergas neviltyje siulo OpenAI darbuotojams 100 mln JAV doleriu premijas dirbti su juo

M. Zuckerbergas neviltyje: „OpenAI“ darbuotojams siūlo 100 mln. JAV dolerių premijas dirbti su juo 

Parengė Rokas B.
2025-06-20
0

Vilniaus rotušėje vyks tarptautinė kvantinių technologijų konferencija. Nuotr. autorius Augustas Didžgalvis. Šaltinis: Wikipedia.

Vilniaus rotušėje vyks tarptautinė kvantinių technologijų konferencija

Parengė Rokas B.
2025-06-20
0

Perspejimas Apple bei Google vartotojams nutekejo 16 mlrd prisijungimo duomenu

Perspėjimas „Apple“ bei „Google“ vartotojams: nutekėjo 16 mlrd. prisijungimo duomenų

Parengė Agnė Vaišnoraitė
2025-06-20
0

Paslaptingas silumos stulpas vaiduoklis naujas atradimas po Omanu glumina mokslininkus

Paslaptingas šilumos „stulpas vaiduoklis“: naujas atradimas po Omanu glumina mokslininkus

Parengė Agnė Vaišnoraitė
2025-06-20
0

Autonominio vaziavimo revoliucija Europoje ar MOIA nukonkuruos Tesla

Autonominio važiavimo revoliucija Europoje: ar „MOIA“ nukonkuruos „Tesla“?

Parengė Agnė Vaišnoraitė
2025-06-20
0

Arteja meteoru audra dangaus sou ar orbitine gresme

Artėja meteorų audra: dangaus šou ar orbitinė grėsmė?

Parengė Rokas B.
2025-06-19
0

Smegenu puvimas mitas ar opi problema

„Smegenų puvimas“ – mitas ar opi problema?

Parengė Rokas B.
2025-06-19
1

Eksperimentas atskleide naujoji Apple DI transkripcija zenkliai lenkia tokius konkurentus kaip OpenAI

Eksperimentas atskleidė: naujoji „Apple“ DI transkripcija ženkliai lenkia tokius konkurentus kaip OpenAI

Parengė Agnė Vaišnoraitė
2025-06-19
0

Microsoft pristato nauja zaidimo konsoliu era stai kas laukia Xbox

„Microsoft“ pristato naują žaidimo konsolių erą: štai kas laukia „Xbox“

Parengė Agnė Vaišnoraitė
2025-06-19
1

Neitiketina astronomijos pergale pristatyta didziausia pasaulyje skaitmenine kamera

Neįtikėtina astronomijos pergalė: pristatyta didžiausia pasaulyje skaitmeninė kamera

Parengė Agnė Vaišnoraitė
2025-06-19
2

Rodyti daugiau
Facebook Youtube

Technologijų inovacijos ir tendencijos vienoje vietoje. Susisiekite: redakcija@technaujienos.lt.

Ad Image
  • Apie mus, reklama ir kontaktai
  • Privatumo politika
  • Žurnalistikos gairės
  • Naudojimosi sąlygos

ℹ️ Draudžiama kopijuoti ir platinti Technaujienos.lt turinį bei nuotraukas be išankstinio raštiško sutikimo.

Kategorijos

  • Auto / Moto
  • Dirbtinis intelektas
  • Energetika
  • Gynyba ir saugumas
  • Išmanieji įrenginiai
  • Kibernetinis saugumas
  • Kosmosas
  • Kriptovaliutos
  • Mokslas ir IT
  • Vaizdo žaidimai
  • Verslas ir technologijos
  • #13527 (be pavadinimo)

© 2023-2025 Technologijų naujienos - Technaujienos.lt - Visos teisės saugomos.

No Result
View All Result
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės

© 2023-2025 Technologijų naujienos - Technaujienos.lt - Visos teisės saugomos.