Section outline

    • Spark tutorial

      This Jupyter notebook is based on the lecture "CS246: Mining Massive Datasets: Crash Course in Spark" by Daniel Templeton.

    • Frequent itemsets mining and Association rules

    • Locality sensitive hashing

    • Visualization of the effect of threshold, band size, and # of rows in LSH by Trenton Chang.

    • Clustering

    • Potrebe po izboljšanju odkrivanja skupin vedno bolj zahtevajo možnost interakcije z domenskimi eksperti, kar je vodilo do razvoja algoritmov odkrivanja skupin z omejitvami (angl. constrained clustering). Ti algoritmi uporabljajo domensko znanje v obliki pozitivnih (angl. must-link) in negativnih omejitev (angl. cannot-link) na pare učnih primerov, kar omogoča izboljšanje procesa odkrivanja skupin...

    • Dimensionality reduction

    • Recommender systems

    • Link Analysis

    • A template for the hubs-and-authorities algorithm - HITS (hyperlink-induced topic search).

    • Graphs

    • V magistrskem delu, ki je rezultiralo v objavi spodnjega članka v ugledni znanstveni reviji Mathematics, uporabimo moderne pristope strojnega učenja na grafih za pohitritev dinamičnega algoritma za iskanje maksimalne klike.

      Kristjan Reba, Matej Guid, Kati Rozman, Dušanka Janežič, and Janez Konc. 
      Exact maximum clique algorithm for different graph types using machine learning. 
      Mathematics 10, no. 1 (2022): 97.
    • Classification

    • Mining data streams