Vedúci práce: RNDr. Peter Gurský, PhD. Autor: Patrik Sedlák

Slides:



Advertisements
Podobné prezentácie
Vkladanie diakritiky s využitím štatistickej analýzy textu
Advertisements

Vyhľadávanie informáci
Algorithmic Chemistry in Genetic Programming Informatics and Information Technologies Student Research Conference, 2006 Vojtech Szöcs Vedúci projektu:
JUDr. Zuzana Adamová, PhD. Mgr. Richard Bednárik
Internet a www.
POUŽITIE POČÍTAČOV V REGIONÁLNEJ GEOGRAFII (2)
OBJAVOVANIE VZOROV POHĽADU PRI NAVIGAČNÝCH ÚLOHÁCH NA WEBE
Publicita malého projektu
Komplexné služby pre váš web
Extrakcia informácií z medicínskych záznamov
Štruktúra semestra – Surveillance (dohľad) nad infekčnými ochoreniami
Academic Internet Television Network Showcases
Školiteľ: Ing. Helena Fidlerová, PhD.

PhDr. Marta Hanečáková, PhD.
Magnetické vlastnosti vybraných rýchlochladených kompozitných materiálov s amorfnou a nanokryštalickou štruktúrou Branislav Kunca Školiteľ: Ivan Škorvánek.
Spracovanie postupnosti pohľadu pravdepodobnostnými modelmi
Návrh projektu Téma: Zlepšovanie odbornej grafickej pripravenosti žiakov Oblasť vzdelávania: Práca s PC Cieľová skupina: rokov (3 - 4 ročník)
Kariérne možnosti v spoločnosti STRABAG.
Nová verejná administratíva II.
Analýza sekvencií pohľadu
Ústav výrobných technológií
Súťaž „Kariérové poradenstvo 2011“
Autor: Patrik Januška Vedúci práce: Ing. Eduard Kuric
Cisco a Internetové siete
Pripomenie ti niečo taká hudba? Vyvolá niečo v tvojích predstavách?
Web of Science V PRAXI Eniko Toth Szasz
Prírodovedné predmety
Doc. RNDr. Jozef Brestenský, CSc.
Predstavuje Nadežda Andrejčíková.
Štruktúra semestra – Surveillance (dohľad) nad infekčnými ochoreniami
FP7: Výskum v prospech MSP
Tvorba a manažment projektov
Windows + Windows Live.
Databázové systémy.
Vplyv hydrostatického tlaku a substitúcie na silne korelované systémy
Vzdelávanie sestier Prof. Mgr. Katarína Žiaková, PhD.
Technická prezentácia
EU project guidelines Mgr. Mária Tunová
Modelovanie kontextov s účelom objavenia skrytých kontextov
Ing. Alojz ANDROVIČ, PhD. – PhDr. Jana MATÚŠKOVÁ Bratislava, máj 2016
Tvorba projektu a prezentačné zručnosti
Zdroje bakalárskej práce
Počítačová podpora výučby odborných predmetov na UCHHSZ Prezentácia
Rozhodovacie džungle a iné klasifikačné algoritmy dolovania údajov
Vedúci diplomovej práce: prof. Ing. Stanislav Marchevský, Csc.
Implementácia a zabezpečenie prevádzky systému ARL – spolupráca knižnice a firmy Dobrý den, vážení a milí, dovolte mi aby som Vam v mene svojom i v mene.
Ponuka DP pre informatikov - UPJŠ
Posudky.
Živočíšna a rastlinná bunka
Aktualizačné vzdelávanie učiteľov cvičných firiem
Prehľad projektu Oblasti vzdelávania Veková skupina Vzdelávacie ciele
VYUŽITIE VÝSLEDKOV PROJEKTU EPANIL NA SLOVENSKU
Bregmanove divergencie Využitie indexovacích štruktúr pre efektívne podobnostné vyhľadávanie Lukáš Holecy Bregmanove divergencie.
Návrat zdravotne znevýhodnených ľudí na trh práce:
Kladistika a další metody rekonstrukce evoluce
(Vieme) Kam kráča svet vedeckého publikovania?
Virtuálna kooperácia pre kultúrne dedičstvo PROJEKT DIZERTAČNEJ PRÁCE
VYHĽADÁVANIE LETECKÝCH ZÁJAZDOV
Testovanie štatistických hypotéz v programe Excel
Tvorba, schémy a príklady Bibliografických odkazov
Štandardy v procese spracovania bibliografických informácií i u nás.
Implementácia inovatívnych foriem a metód výučby na ZŠ Bežovce
Kapowtech RoboSuite Team10.
ČEPS prípadová štúdia Ako efektívne využiť virtuálnu realitu v energetike Vladimír Broniš
Slovenská poľnohospodárska univerzita v Nitre
Vytvorenie diagramu zasadacieho poriadku
prof. RNDr. Libor Vozár, CSc. Univerzita Konštantína Filozofa v Nitre
Diplomová práca Koncept testovacieho zariadenia na testovanie energetických strát synchro systému Obdobie/Periode 2019/2020 Cieľ práce/Objectives: Zameranie/Fields:
Obsah prezentácie digitálna prezentácia Desatoro
Prepis prezentácie:

Vedúci práce: RNDr. Peter Gurský, PhD. Autor: Patrik Sedlák Škálovateľný proces získavania, extrakcie, deduplikácie a prezentácie webových dát Vedúci práce: RNDr. Peter Gurský, PhD. Autor: Patrik Sedlák

Motivácia

0. cieľ práce Porozumieť jednotlivým nástrojom projektu Kapsa, s akými dátami pracujú, odkiaľ ich získavajú, kam ich posielajú, ...

1. cieľ práce Vytvorenie a nasadenie automatického procesu opakovaného získavania, extrakcie, deduplikácie a prezentácie dát z internetových obchodov s využitím príslušných nástrojov projektu Kapsa, realizujúcich príslušné operácie.

2. cieľ práce Realizácia výkonnostného testu a analýza úzkych miest nasadeného riešenia. Test pre veľké množstvo zdrojov (stránok) Test pre veľké množstvo užívateľov Ktorý modul akú záťaž zvládne?

3. cieľ práce Návrh a realizácia škálovateľného distribuovaného spracovania odhalených úzkych miest v rámci automatického procesu a jeho porovnanie s pôvodným riešením.

Literatúra Apache Beam: An advanced unified programming model. Dostupné na webe: https://beam.apache.org/ Tyler Akidau et al.: The Dataflow Model: A Practical Approach to Balancing Correctness, Latency, and Cost in MassiveScale, Unbounded, OutofOrder Data Processing. Proceedings of the VLDB Endowment, Vol. 8, No. 12 (2015) I. Holubová et al.: Big Data a NoSQL databáze. Praha: Grada, ISBN 9788024754666 (2015)

Ďakujem za pozornosť