„Google“ paskelbė „Paieškos reitingavimo algoritmo vadovą“
„Google“ paskelbė naują dokumentą „Paieškos reitingavimo algoritmų vadovas“, kuriame aprašomos visos atitinkamos paieškos technologijos – tiek dabartinės, tiek jau nebenaudojamos paieškoje arba įtrauktos į kitus algoritmus.
Dabartiniai algoritmai apima:
1. BERT (Bidirectional Encoder Representations from Transformers) yra natūralios kalbos apdorojimo metodas, pagrįstas naujos architektūros neuroninių tinklų naudojimu dirbti su sekomis, žinomomis kaip “transformatoriai”. Ši technologija padeda „Google“ geriau nustatyti žodžių kontekstą paieškos užklausose.
2. Krizių informacija (Crisis information) – teikti vartotojams naudingą ir savalaikę informaciją krizinių situacijų metu, tiek asmeninių, tiek objektyvių – stichinių nelaimių, epidemijų ir kt.
3. Deduplikacija (Deduplication) – paieškos rezultatų valymui nuo pasikartojančių puslapių ir snipetų (pasirinktų fragmentų).
4. Raktiniai žodžiai domenuose (Exact match domain) – siekiant išvengti pirmųjų vietų išduodant domeno puslapius, tiksliai atitinkačius užklausą.
5. Turinio šviežumas (Freshness) – rodyti aktualiausius rezultatus užklausoms, susijusioms su naujausiais įvykiais / leidimais / premjeromis ir kitomis „karštomis“ temomis (naujienos, apžvalgos, praktinė informacija).
6. Naudingas turinys (Helpful content) skirtas tam, kad neoriginalus ir nekokybiškas turinys, sukurtas tik geriems paieškos sistemų reitingams, o ne siekiant padėti ar informuoti žmones, nepatektų į pirmąsias vietas išleidžiant neoriginalų ir nekokybišką turinį. .
7. Nuorodų analizė ir PageRank ((Link analysis systems and PageRank) – suprasti, kaip puslapiai susieja vienas su kitu ir kurie iš jų yra naudingiausi atsakant į užklausą. Taip pat įvertinti svetainės nuorodų profilį ir nukreipiančių puslapių autoritetą.
8. Vietinės naujienos (Local news) – identifikuoti ir parodyti vartotojui naujienas iš vietinių šaltinių
9. MUM (Multitask Unified Model) – AI technologija, skirta sudėtingoms paieškos užklausoms apdoroti. Ji dar nenaudojama bendram paieškos reitingavimui, o tik kai kurioms paieškos funkcijoms tobulinti, pvz., atliekant multipaiešką ir kuriant svarbiausius fragmentus (Featured Snippet).
10. Neuroninis atitikimas (Neural Matching, NM) – AI technologija, naudojama geriau susieti žodžius su sąvokomis – paieškos užklausų ir tinklalapių atitikimas neatsižvelgiant į kitus veiksnius.
11. Unikalus turinys (Original content) – paieškai ir geresniam pirminių šaltinių reitingavimui.
12. Pesimizacija pašalinimo pagrindu (Removal-based demoction) – išteklių, kuriuose yra daug šalinamo turinio, reitingo sumažėjimas – pažeidžiamos autorių teisės arba yra asmeninės informacijos.
13. Puslapio patirtis (Page Experience) – atpažinti ir aukštesnį reitingą puslapiams, kurie suteikia puikią vartotojo patirtį – greitai įkeliami, pritaikyti mobiliesiems, be įkyrių skelbimų ir pan.
14. Fragmentų reitingavimas (Passage Ranking) – dirbtinio intelekto technologija, skirta geriau suprasti puslapius su geru, bet prastos struktūros turiniu. Geba suprasti teksto fragmentų turinį ir rūšiuoti juos pagal aktualumą.
15. Atsiliepimų reitingavimas (Product reviews) – detalių, ekspertų ir patikimų atsiliepimų apie prekes ar paslaugas prioritetiniam reitingavimui.
16. RankBrain – AI technologija, padedanti paieškai suprasti ryšį tarp žodžių ir sąvokų, leidžianti pagal poreikį pateikti atitinkamą turinį, net jei jame nėra tikslaus raktinių žodžių atsiradimo.
17. Patikima informacija (Reliable information) – pateikti patikimiausią informaciją paieškos rezultatuose identifikuojant autoritetingiausius puslapius ir sumažinant žemos kokybės turinio pozicijas.
18. Svetainių įvairovė (Site diversity) – leidžia geriausiuose užklausos paieškos rezultatuose nerodyti daugiau nei dviejų rezultatų iš to paties domeno. Išimtis yra tada, kai daugiau rezultatų iš to paties domeno suteikia daugiau aktualumo konkrečiai užklausai.
19. Šlamšto aptikimas (Spam detection) – apima daugybę technologijų, skirtų aptikti šlamštą internete, įskaitant SpamBrain, pagrįstą dirbtiniu intelektu.
„Google“ pažymėjo, kad visi dabartiniai reitingavimo algoritmai yra reguliariai tobulinami atliekant griežtą testavimą ir vertinimą. Paieškos sistema apie ypač reikšmingus algoritmų atnaujinimus praneša specialiame puslapyje, kai mano, kad jie gali būti naudingi turinio kūrėjams ir kitiems vartotojams.
Be to, „Google“ atstovas Danny Sullivanas teigė, kad ateityje paieškos sistema nustos reitingavimo algoritmus vadinti „atnaujinimais“ (update), kad nieko nesuklaidintų:
„Ateityje tikslesnes formuluotes, atskirdami algoritmus nuo atnaujinimų. Taip, vis tiek turėsime tokius dalykus kaip „naudingas turinio atnaujinimas“ arba „produkto apžvalgos atnaujinimas“, tačiau, jei įmanoma, paaiškinsime, kad tai yra susijusių algoritmų, pvz., „turinio naudingumo“ ir „peržiūrų reitingavimo“, atnaujinimai. Taip pat atitinkamai pakeisime savo informacinę informaciją, kad atspindėtų šį terminų pasikeitimą.
Informacija apie algoritmus, kurie nebenaudojami paieškoje arba tapo kitų technologijų dalimi, pateikiama tik kaip „istoriškai reikšminga“:
- Hummingbird – išleistas 2013 m. ir nebenaudojamas.
- Patogus mobiliesiems (Mobile friendly) – buvo paleistas 2015 m., o vėliau tapo „Page Experience“ algoritmo dalimi.
- Puslapio greitis (Page Speed) – paleistas 2018 m., dabar yra „Page Experience“ algoritmo dalis.
- Panda – pristatyta 2011 m., nuo tada ji tapo pagrindinio Google reitingavimo algoritmo dalimi 2015 m.
- Pingvinas – pristatytas 2012 metais, 2016 metais tapo pagrindinio Google reitingavimo algoritmo dalimi.
- Saugi svetainių sistema (Secure sites system) buvo paskelbta 2014 m. ir reiškė, kad kai visi kiti faktoriai bus vienodi, svetainės, apsaugotos HTTPS protokolu bus geriau vertinamos Google reitingavimo sistemose. Dabar tai tapo puslapio naudojimo patirties algoritmo dalimi.