Pietro Lesci

pietrolesci

https://pietrolesci.github.io/

AI & ML interests

I like developing and applying causal methods to study the effect of training choices on models’ behaviour, including memorisation, shortcut learning, and tokenisation.

Organizations

Collections 11

View 11 collections

Papers 6

models 27

datasets 56

pietrolesci/unimixlm

Viewer • Updated Jul 25, 2025 • 81.9M • 971

pietrolesci/me-minipile-evals

Viewer • Updated Jun 3, 2025 • 1.22M • 71

pietrolesci/pile-deduped

Viewer • Updated May 5, 2025 • 748M • 7

pietrolesci/pythia-deduped-memorisation-profiles

Viewer • Updated Apr 9, 2025 • 2.13M • 22

pietrolesci/pile-validation

Viewer • Updated Apr 9, 2025 • 429k • 96

pietrolesci/pile-deduped-subset

Viewer • Updated Apr 9, 2025 • 16.3k • 11

pietrolesci/pythia-deduped-stats

Viewer • Updated Apr 9, 2025 • 16.3M • 71

pietrolesci/pythia-deduped-stats-raw

Viewer • Updated Apr 9, 2025 • 14.9M • 2.49k

pietrolesci/agnews

Viewer • Updated Apr 9, 2025 • 510k • 87

pietrolesci/amazoncat-13k

Viewer • Updated Apr 9, 2025 • 5.99M • 423 • 2

View 56 datasets

Pietro Lesci

AI & ML interests

Organizations

Collections 11

Papers 6

models 27 Sort: Recently updated

datasets 56 Sort: Recently updated

models 27

datasets 56