Hlavní stránka › Fóra › Forum pro soutěžící SOČ › 42. celostátní přehlídka ONLINE › 42. CP SOČ online – obor 18 informatika › Odpověď na téma: 42. CP SOČ online – obor 18 informatika
Vážená poroto,
pokusím se co nejpřesněji zodpovědět na Vaše otázky.
1)Počítáte s možností, že zpravodajské servery občas uveřejněné články aktualizují? Změní se tím obsah a tím pádem i relevance ve vašem algoritmu.
Ano, program pravidelně stahuje články za poslední 2 dny přibližně každou hodinu a kontroluje, jestli se jejich obsah nezměnil. Tyto průběžné aktualizace jsou potřebné k vytvoření kvalitní sítě článků uvnitř programu. Pokud dojde ke změně textu článků, dojde k jeho znovuzaembeddingování (převedení textu na vektor) a program bude pracoval už pouze s tímto novým vektorem. Pokud článek ještě nebyl publikován, dojde ke zveřejnění jeho nejnovější verze.
Obsah už publikovaného příspěvku se nemění, protože to sítě Instagram a Twitter API neumožňují, a tak by bylo jedinou možností vytvořit nový příspěvek. Této variantě se snažím vyhnout, aby nebyl uživatel zahlcen duplicitními příspěvky. Cílem této práce je mít příspěvky napříč sociálními sítěmi jednotné, takže z toho důvodu se ani na Facebooku neaktualizují.
2. Jak byste srovnal svůj systém s existujícími agregátory zpráv typu GoogleNews?
Výhodou mého projektu je právě využití sociálních sítí, kdy příspěvky mohou zasáhnout a dostat se k mladší generaci. V takovém případě za mě sociální síť přiřadí zprávy k uživatelům podle jejich preferencí a zobrazí se jim. Uživatel tedy nemusí vystupovat ze své komfortní zóny, tedy vyhledávat si zprávy online, ale vidí obsahově preferované články na svém feedu.
Algoritmus různých agregátorů je využíván pouze danou společností a není k němu umožněn přístup dalším subjektům, zatímco v současné době dochází k implementaci programu Měj Přehled do zpravodajské aplikace NewsKit a na stránkách Seznamu.
S pozdravem
Michal Bravanský