Biztosan lenyűgöz majd a Microsoft böngészőjének legújabb funkciója!


Megérkezett a Microsoft legfrissebb AI innovációja, a Copilot Vision, amely elméletileg már a kiválasztott felhasználók számára is elérhető az Edge böngészőn keresztül. Ez a mesterséges intelligencia forradalmasíthatja az interakciót, hiszen most először kínál lehetőséget arra, hogy a felhasználók megosszák képernyőjüket, és a Copilot Vision ennek megfelelően reagáljon a látottakra. Azonban van egy kis hátránya: sajnos magunk sem tudtuk még tesztelni a funkciót, és úgy tűnik, ezzel nem vagyunk egyedül.

A Microsoft újabb izgalmas lépést tett a mesterséges intelligencia világában, bejelentve, hogy a Copilot Vision névre keresztelt AI funkció mostantól ingyenesen elérhető az Edge böngésző felhasználói számára. A bejelentést Mustafa Suleyman, a vállalat AI részlegének vezérigazgatója osztotta meg a Bluesky közösségi platformon. Ez a lépés új lehetőségeket nyit meg a felhasználók előtt, lehetővé téve számukra, hogy kihasználják a legújabb technológiai vívmányokat a böngészési élményük javítása érdekében.

A Microsoft által bemutatott Copilot Vision egy forradalmian új, "beszéd alapú élmény", amely lehetővé teszi a felhasználók számára, hogy hangparancsokkal lépjenek kapcsolatba a mesterséges intelligenciával. Amit azonban igazán különlegessé tesz, az a képessége, hogy valós időben képes értelmezni a felhasználó képernyőjén megjelenő tartalmakat. Ez a funkció új dimenziókat nyit az online interakciók és az alkalmazások használata terén. Hasonló élményt eddig csupán a Google Pixel és a Galaxy S25 mobilokon tapasztalhattunk a Gemini Live segítségével, de most a Copilot Vision révén szélesebb körben válik elérhetővé.

Suleyman kiemelte, hogy az opcionálisan bekapcsolható funkcióval a Copilot Vision "szó szerint láthatja, amit mi magunk is a képernyőn". A vezérigazgató példaként említette, hogy a Vision segíthet egy recept követésében főzés közben, vagy akár egy bonyolultabb álláshirdetés "dekódolásában" is, megkönnyítve az interjúra való felkészülést és a motivációs levelek megírását. Fontos azonban megjegyezni, hogy a Microsoft támogatási oldala szerint

A Copilot Pro előfizetők számára hamarosan elérhetővé válik a Copilot Vision, amely nemcsak a Microsoft Edge böngészőben, hanem a Windows 11 operációs rendszer minden területén hozzáférhető lesz. Ez azt jelenti, hogy a felhasználók könnyedén igénybe vehetik ezt az új funkciót különböző alkalmazásokban, például a Photoshopban, videószerkesztő programokban, vagy akár népszerű játékokban, mint a Minecraft.

Ha ki szeretné próbálni az ingyenes Copilot Visiont, egyszerűen csak kattintson erre a linkre a Microsoft Edge böngészőn belül. A rövid oktatóvideó megtekintése, és az engedélyek megadása után a Copilot oldalsávjában található mikrofon ikonra kattintva indítható el a Vision munkamenet, amelyet egy hangjelzés és a böngésző színének enyhe megváltozása jelez; már amennyiben az ön esetében elérhető a fejlesztés, nekünk ugyanis egyelőre nem engedte a Microsoft, hogy kipróbáljuk azt.

Lehetséges, hogy ez nem csupán a véletlen műve. Az első visszajelzések szerint a Vision használata nem volt problémamentes a felhasználók többsége számára. A The Verge újságírójának például többszöri kísérletre volt szüksége ahhoz, hogy az Edge végre felajánlja az engedélyezési lehetőséget, de még ezután sem sikerült megjelenítenie a szükséges vezérlőket.

És ha már a használatnál tartunk, fontos kitérni a Microsoft álláspontjára is az adatvédelmet illetően. A vállalat hangsúlyozza, hogy a Copilot kivétel nélkül rögzíti a felhasználóknak adott válaszokat, de nem gyűjti a bemeneteket, képeket vagy az oldal tartalmát a Vision munkamenet során, ami azt jelenti, hogy elméletben a képernyőn látott információk nem kerülhetnek a Microsoft kezébe. A képernyőmegosztás leállításához a felhasználók befejezhetik a munkamenetet vagy bezárhatják a böngészőablakot.

Az utóbbi hónapokban a mesterséges intelligencia fejlődése rendkívüli ütemet öltött, különösen az OpenAI által fejlesztett ChatGPT és a Google által létrehozott Gemini esetében. A ChatGPT tavasz elején debütáló új képalkotó modellje hatalmas népszerűségnek örvendett, különösen a Studio Ghibli-esztétikának köszönhetően, ami szinte az egész internetet elvarázsolta. Ezt követően a ChatGPT megújult memória funkciója vegyes reakciókat váltott ki a felhasználók körében. Ahogyan az Index is beszámolt róla, ez az újítás lehetővé tette, hogy korlátozott mennyiségű információt – például lekérdezéseket és testreszabási beállításokat – megőrizzünk, ezzel segítve a jövőbeli válaszok még személyre szabottabbá tételét.

Ezek mellett pedig a Google sem unatkozott. Amellett, hogy elérhetővé tették a Gemini legújabb, 2.5-ös modelljét, egy Copilot Visionhöz hasonló funkciót is bevezettek, ami a Microsoft megoldásával ellentétben működik is. A Gemini Live különlegessége, hogy amellett, hogy látja és értelmezi, ami megjelenik a telefon kijelzőjén, a mobil kamerájával is összeköthetjük, így a külvilággal kapcsolatos dolgokra is azonnal reagálni tud. Például segíthet egy növény felismerésében, miközben gondozási tippeket ad - de egy koncertplakátot megmutatva neki egy pillanat alatt létrehozhat egy eseményt a naptárunkban.

A Gemini Live szolgáltatás jelenleg kizárólag a Google Pixel és a Samsung Galaxy S25 telefonokon érhető el ingyenesen. A jövőben azonban várható, hogy más androidos és iOS-es eszközökre is eljut, ám ebben az esetben a Gemini Advanced előfizetés szükséges lesz a használatához. Ezzel szemben a Copilot Vision úgy tűnik, hogy egyelőre ingyenes marad az Edge böngésző felhasználói számára – a kérdés csupán az, hogy mikor válik ténylegesen elérhetővé.

Related posts