„Google“ pristato atnaujinimą BERT – didžiausią proveržį paieškoje per 5 metus
„Google“ oficialiai paskelbė apie atnaujinimą BERT , kurį bendrovė pavadino „didžiausiu proveržiu per pastaruosius 5 metus ir vienu didžiausių kokybės šuolių paieškos istorijoje“.
Naujas algoritmas padeda „Google“ geriau suprasti natūralios kalbos užklausas. Tai apima 1 iš 10 JAV paieškų anglų kalba. Laikui bėgant „Google“ planuoja išplėsti šį atnaujinimą į daugiau šalių ir kalbų.
Praėjusiais metais „Google“ padarė atviru „Bidirectional Encoder Representations from Transformers“, arba sutrumpintai BERT, kodą, paremtą mašinos mokymusi. Ši technologija leidžia mokyti sistemas atsakyti į klausimus.
„Google“ taiko BERT modelius reitinguodama ir formuodama matomus fragmentus (featured snippets). Paieškos reitingavime tai taikoma tik užklausoms anglų kalba, o pasirinktiems fragmentams – daugiau nei 20 pasaulio šalių, kuriose ši funkcija veikia. BERT dėka paieškos variklis žymiai patobulino pateiktus fragmentus korėjiečių, portugalų, hindi ir kitomis kalbomis.
BERT padeda „Google“ „suprasti“ ilgesnes natūralios kalbos užklausas, kur svarbūs tokie prielinksniai kaip „for“ ir „to“. Kaip vieną iš pavyzdžių „Google“ pateikė užklausą [2019 brazil traveler to usa need a visa]. Anksčiau paieškos sistema pateikdavo rezultatus JAV piliečiams, vykstantiems į Braziliją, nors iš tikrųjų čia kalbama apie Brazilijos turistų apsilankymą JAV. Dabar „Google“ teisingai supranta tokias užklausas, atsižvelgdama į „to“.
„Google“ taip pat naudojasi BERT siekdama patobulinti paiešką visame pasaulyje – išvados, padarytos dėl vienos kalbos, galioja ir kitoms. Tai padeda grąžinti aktualesnius rezultatus ne tik angliškai, bet ir daugeliu kitų kalbų.
Šis proveržis tapo rezultatu „Google“ tyrimų, susijusių su „transformeriais“ – naujos architektūros neuroniniais tinklais, skirtais darbui su sekomis, kurios apdoroja žodžius atsižvelgdami į visus kitus sakinio žodžius, o ne eilės tvarką. Analizuodami turinį prieš ir po žodžio BERT modeliai sugeba nustatyti visą jo kontekstą, o tai ypač naudinga norint suprasti paieškos užklausos reikšmę.
Tačiau kai kurie BERT modeliai yra tokie sudėtingi, kad „Google“ teko atnaujinti techninę įrangą. Įmonė pirmą kartą pradėjo naudoti naujausius debesies TPU (Tensor Processing Unit), kad pateiktų paieškos rezultatus.
Dėl algoritmo atnaujinimo, greičiausiai, bus mažiau neatitinkančių užklausos paieškos rezultatų, ypač susijusių su žemo dažnio užklausomis. Dažnai naudojamiems raktažodžiams tikriausiai niekas nepasikeis.