Vedúci práce: RNDr. Peter Gurský, PhD. Autor: Patrik Sedlák

Slides:

Advertisements

Podobné prezentácie

Vkladanie diakritiky s využitím štatistickej analýzy textu

Advertisements

Vyhľadávanie informáci

Algorithmic Chemistry in Genetic Programming Informatics and Information Technologies Student Research Conference, 2006 Vojtech Szöcs Vedúci projektu:

JUDr. Zuzana Adamová, PhD. Mgr. Richard Bednárik

Internet a www.

POUŽITIE POČÍTAČOV V REGIONÁLNEJ GEOGRAFII (2)

OBJAVOVANIE VZOROV POHĽADU PRI NAVIGAČNÝCH ÚLOHÁCH NA WEBE

Publicita malého projektu

Komplexné služby pre váš web

Extrakcia informácií z medicínskych záznamov

Štruktúra semestra – Surveillance (dohľad) nad infekčnými ochoreniami

Academic Internet Television Network Showcases

Školiteľ: Ing. Helena Fidlerová, PhD.

PhDr. Marta Hanečáková, PhD.

Magnetické vlastnosti vybraných rýchlochladených kompozitných materiálov s amorfnou a nanokryštalickou štruktúrou Branislav Kunca Školiteľ: Ivan Škorvánek.

Spracovanie postupnosti pohľadu pravdepodobnostnými modelmi

Návrh projektu Téma: Zlepšovanie odbornej grafickej pripravenosti žiakov Oblasť vzdelávania: Práca s PC Cieľová skupina: rokov (3 - 4 ročník)

Kariérne možnosti v spoločnosti STRABAG.

Nová verejná administratíva II.

Analýza sekvencií pohľadu

Ústav výrobných technológií

Súťaž „Kariérové poradenstvo 2011“

Autor: Patrik Januška Vedúci práce: Ing. Eduard Kuric

Cisco a Internetové siete

Pripomenie ti niečo taká hudba? Vyvolá niečo v tvojích predstavách?

Web of Science V PRAXI Eniko Toth Szasz

Prírodovedné predmety

Doc. RNDr. Jozef Brestenský, CSc.

Predstavuje Nadežda Andrejčíková.

Štruktúra semestra – Surveillance (dohľad) nad infekčnými ochoreniami

FP7: Výskum v prospech MSP

Tvorba a manažment projektov

Windows + Windows Live.

Databázové systémy.

Vplyv hydrostatického tlaku a substitúcie na silne korelované systémy

Vzdelávanie sestier Prof. Mgr. Katarína Žiaková, PhD.

Technická prezentácia

EU project guidelines Mgr. Mária Tunová

Modelovanie kontextov s účelom objavenia skrytých kontextov

Ing. Alojz ANDROVIČ, PhD. – PhDr. Jana MATÚŠKOVÁ Bratislava, máj 2016

Tvorba projektu a prezentačné zručnosti

Zdroje bakalárskej práce

Počítačová podpora výučby odborných predmetov na UCHHSZ Prezentácia

Rozhodovacie džungle a iné klasifikačné algoritmy dolovania údajov

Vedúci diplomovej práce: prof. Ing. Stanislav Marchevský, Csc.

Implementácia a zabezpečenie prevádzky systému ARL – spolupráca knižnice a firmy Dobrý den, vážení a milí, dovolte mi aby som Vam v mene svojom i v mene.

Ponuka DP pre informatikov - UPJŠ

Živočíšna a rastlinná bunka

Aktualizačné vzdelávanie učiteľov cvičných firiem

Prehľad projektu Oblasti vzdelávania Veková skupina Vzdelávacie ciele

VYUŽITIE VÝSLEDKOV PROJEKTU EPANIL NA SLOVENSKU

Bregmanove divergencie Využitie indexovacích štruktúr pre efektívne podobnostné vyhľadávanie Lukáš Holecy Bregmanove divergencie.

Návrat zdravotne znevýhodnených ľudí na trh práce:

Kladistika a další metody rekonstrukce evoluce

(Vieme) Kam kráča svet vedeckého publikovania?

Virtuálna kooperácia pre kultúrne dedičstvo PROJEKT DIZERTAČNEJ PRÁCE

VYHĽADÁVANIE LETECKÝCH ZÁJAZDOV

Testovanie štatistických hypotéz v programe Excel

Tvorba, schémy a príklady Bibliografických odkazov

Štandardy v procese spracovania bibliografických informácií i u nás.

Implementácia inovatívnych foriem a metód výučby na ZŠ Bežovce

Kapowtech RoboSuite Team10.

ČEPS prípadová štúdia Ako efektívne využiť virtuálnu realitu v energetike Vladimír Broniš

Slovenská poľnohospodárska univerzita v Nitre

Vytvorenie diagramu zasadacieho poriadku

prof. RNDr. Libor Vozár, CSc. Univerzita Konštantína Filozofa v Nitre

Diplomová práca Koncept testovacieho zariadenia na testovanie energetických strát synchro systému Obdobie/Periode 2019/2020 Cieľ práce/Objectives: Zameranie/Fields:

Obsah prezentácie digitálna prezentácia Desatoro

Prepis prezentácie:

Vedúci práce: RNDr. Peter Gurský, PhD. Autor: Patrik Sedlák Škálovateľný proces získavania, extrakcie, deduplikácie a prezentácie webových dát Vedúci práce: RNDr. Peter Gurský, PhD. Autor: Patrik Sedlák

Motivácia

0. cieľ práce Porozumieť jednotlivým nástrojom projektu Kapsa, s akými dátami pracujú, odkiaľ ich získavajú, kam ich posielajú, ...

1. cieľ práce Vytvorenie a nasadenie automatického procesu opakovaného získavania, extrakcie, deduplikácie a prezentácie dát z internetových obchodov s využitím príslušných nástrojov projektu Kapsa, realizujúcich príslušné operácie.

2. cieľ práce Realizácia výkonnostného testu a analýza úzkych miest nasadeného riešenia. Test pre veľké množstvo zdrojov (stránok) Test pre veľké množstvo užívateľov Ktorý modul akú záťaž zvládne?

3. cieľ práce Návrh a realizácia škálovateľného distribuovaného spracovania odhalených úzkych miest v rámci automatického procesu a jeho porovnanie s pôvodným riešením.

Literatúra Apache Beam: An advanced unified programming model. Dostupné na webe: https://beam.apache.org/ Tyler Akidau et al.: The Dataflow Model: A Practical Approach to Balancing Correctness, Latency, and Cost in MassiveScale, Unbounded, OutofOrder Data Processing. Proceedings of the VLDB Endowment, Vol. 8, No. 12 (2015) I. Holubová et al.: Big Data a NoSQL databáze. Praha: Grada, ISBN 9788024754666 (2015)

Ďakujem za pozornosť