Неделя: Prosojnice in dodatna gradiva / Slides and supplementary materials | IP (A) (Tools for Large Database Analysis)

Spark tutorial

This Jupyter notebook is based on the lecture "CS246: Mining Massive Datasets: Crash Course in Spark" by Daniel Templeton.

Jupyter notebook: Spark Tutorial Файл IPYNB

40.0 Кбайт

Jupyter notebook: Spark Tutorial (HTML) Файл HTML

714.1 Кбайт

Frequent itemsets mining and Association rules

Pogosti nabori predmetov in povezovalna pravila Файл PDF

1.1 Мбайт

Jupyter notebook: Finding frequent itemsets with the Apriori algorithm Файл IPYNB

14.4 Кбайт

Locality sensitive hashing

Finding Similar Items: Locality Sensitive Hashing (CS246 2022) Файл PDF

2.5 Мбайт

Theory of Locality Sensitive Hashing (CS246 2022) Файл PDF

2.1 Мбайт

Visualization of the effect of threshold, band size, and # of rows in LSH by Trenton Chang.

Clustering

Odkrivanje skupin Файл PDF

2.5 Мбайт

Odkrivanje skupin z omejitvami Файл PDF

Potrebe po izboljšanju odkrivanja skupin vedno bolj zahtevajo možnost interakcije z domenskimi eksperti, kar je vodilo do razvoja algoritmov odkrivanja skupin z omejitvami (angl. constrained clustering). Ti algoritmi uporabljajo domensko znanje v obliki pozitivnih (angl. must-link) in negativnih omejitev (angl. cannot-link) na pare učnih primerov, kar omogoča izboljšanje procesa odkrivanja skupin...

1.3 Мбайт

Dimensionality reduction

SVD demo Файл XLSX

15.7 Кбайт

Eigenvalues and Eigenvectors of a Matrix by Ben Kuttler

Recommender systems

Priporočilni sistemi Файл PDF

1.5 Мбайт

Link Analysis

PageRank & HITS Файл PDF

1.1 Мбайт

PageRank & HITS - simulacija Файл XLSX

27.5 Кбайт

Spark & HITS Файл

A template for the hubs-and-authorities algorithm - HITS (hyperlink-induced topic search).

Загружено 22/02/24, 15:37

Graphs

Iskanje maksimalne klike v proteinskem grafu Файл PDF

V magistrskem delu, ki je rezultiralo v objavi spodnjega članka v ugledni znanstveni reviji Mathematics, uporabimo moderne pristope strojnega učenja na grafih za pohitritev dinamičnega algoritma za iskanje maksimalne klike.

Kristjan Reba, Matej Guid, Kati Rozman, Dušanka Janežič, and Janez Konc. 
Exact maximum clique algorithm for different graph types using machine learning. 
Mathematics 10, no. 1 (2022): 97.

3.6 Мбайт

Classification

Uvrščanje Файл PDF

1.7 Мбайт

Mining data streams

Testna Spletna učilnica FRI 24/25 (NE UREJAJTE VSEBINE, produkcijska Spletna učilnica FRI 24/25 bo druga instanca)

Prosojnice in dodatna gradiva / Slides and supplementary materials

Section outline