diff --git a/.obsidian/types.json b/.obsidian/types.json index 8e2208b..7381410 100644 --- a/.obsidian/types.json +++ b/.obsidian/types.json @@ -24,6 +24,7 @@ "TQ_show_task_count": "checkbox", "TQ_show_toolbar": "checkbox", "TQ_show_tree": "checkbox", - "TQ_show_urgency": "checkbox" + "TQ_show_urgency": "checkbox", + "author": "multitext" } } \ No newline at end of file diff --git a/.obsidian/workspace.json b/.obsidian/workspace.json index c6e42a1..a549521 100644 --- a/.obsidian/workspace.json +++ b/.obsidian/workspace.json @@ -13,13 +13,13 @@ "state": { "type": "markdown", "state": { - "file": "Thèse/Axes/Phylogénie/SBM avec covariance latente.md", + "file": "Thèse/Projets annexes/Application colBiSBM réseaux d'optimisation de NN.md", "mode": "source", "source": false, "backlinks": false }, "icon": "lucide-file", - "title": "SBM avec covariance latente" + "title": "Application colBiSBM réseaux d'optimisation de NN" } } ] @@ -197,19 +197,9 @@ "icon": "quote-glyph", "title": "References" } - }, - { - "id": "6734703bbf1b5f03", - "type": "leaf", - "state": { - "type": "git-view", - "state": {}, - "icon": "git-pull-request", - "title": "Source Control" - } } ], - "currentTab": 8 + "currentTab": 7 } ], "direction": "horizontal", @@ -237,16 +227,23 @@ }, "active": "5a22d122169dedf7", "lastOpenFiles": [ + "macros.tex.md", + "Thèse/Projets annexes/Application colBiSBM réseaux d'optimisation de NN.md", + "Thèse/Lectures/local_macros.tex.md", + "Thèse/Projets annexes/VGAE avec (Gromov-)Wasserstein.md", + "Thèse/Projets annexes/Applications colBiSBM pour impact pratiques agris sur interactions plantes pollinisateurs.md", + "Thèse/TODO/2026-05-18.md", + "Thèse/Projets annexes", + "Thèse/Axes/Phylogénie/SBM avec covariance latente.md", + "Thèse/Résolution des problèmes/Problème avec renv.md", "Thèse/Lectures/@quericBridgingMaximumLikelihood2026.md", "@quericBridgingMaximumLikelihood2026.md", "Thèse/Articles/Review papier colBiSBM.md", "Résumé des tâches.md", - "Thèse/TODO/2026-05-18.md", "Thèse/Résumés séminaires.md", "Thèse/Séminaires/2026-06-09 VICTOR François.md", "Thèse/Séminaires/2026-06-09 FRANCHETERRE Blanche.md", "Perso/Tâches/2026-05-17.md", - "Thèse/Axes/Phylogénie/SBM avec covariance latente.md", "Thèse/Axes/projets-phylo.qmd", "Thèse/Tutoriel ABC.md", "Bienvenue.md", @@ -261,17 +258,10 @@ "Thèse/StateOfTheR/HappyR", "Thèse/StateOfTheR", "Thèse/Groupes de travail/Modèles génératifs/VAE pour la régularisation de problème inverse.md", - "Thèse/Séminaires/2026-05-28 SILVA BERNARDES Juliana.md", "Thèse/Groupes de travail/Modèles génératifs", "Thèse/Groupes de travail", - "Meta/Modèles/Séminaire_Template.md", - "Thèse/Séminaires/2026-05-28 NOM.md", - "Thèse/Séminaires/2026-05-28.md", - "Thèse/Séminaires/null.md", - "2026-05-28.md", "public/index-listing.json", "index-listing.json", - "site_libs/quarto-listing/quarto-listing.js", - "site_libs/quarto-listing/list.min.js" + "site_libs/quarto-listing/quarto-listing.js" ] } \ No newline at end of file diff --git a/Thèse/Articles/Review papier colBiSBM.md b/Thèse/Articles/Review papier colBiSBM.md index 20aa773..8b6b1e6 100644 --- a/Thèse/Articles/Review papier colBiSBM.md +++ b/Thèse/Articles/Review papier colBiSBM.md @@ -123,7 +123,7 @@ Thank you for your submission. I hope these comments enable you to revise the wo - [x] Lire le papier de [[@neumannBipartiteStochasticBlock2018]] 🆔 d2pqyo ✅ 2026-06-01 - [x] Lire le papier ArXiv de Pierre sur la taille pour ajouter Neumann en conclusion. ✅ 2026-06-09 - [ ] Ajouter les VGAEs dans le dépôt code-colBiSBM 🆔 hszuud -- [ ] Reprendre les VGAE sur Baldock et faire tourner avec : ⛔ hszuud +- [ ] Reprendre les VGAE sur Baldock et faire tourner avec : 🆔 p0n5me ⛔ hszuud + une constante + Le degré corrigé des NAs - [x] Il faut qu'on discute de comment on parle du point 1 du reviewer 1 sur comment adoucir l'hypothèse des $\alpha$ ✅ 2026-06-09 diff --git a/Thèse/Axes/Phylogénie/SBM avec covariance latente.md b/Thèse/Axes/Phylogénie/SBM avec covariance latente.md index ce5f2e2..925bb80 100644 --- a/Thèse/Axes/Phylogénie/SBM avec covariance latente.md +++ b/Thèse/Axes/Phylogénie/SBM avec covariance latente.md @@ -1,3 +1,7 @@ +# Inclusion dans la thèse + +Ce modèle ci est une proposition pour remettre en cause l'hypothèse du LBM d'indépendance des $Z_{i}$ en définissant une structure de dépendance dépendantes de la phylogénie. + # Idée du modèle ![[local_macros.tex]] @@ -825,35 +829,25 @@ $$ \end{align*} $$ -**A MODIFIER** - -On a : +À la fin $$ - \begin{align*} - p(Z_{i}\mid P_{i}) & = \ilr^{-1}(P_{i}) = (\pi_{i,1},\dots,\pi_{i,k},\dots,\pi_{i,K}) \\ - p(Y_{i,\bullet}\mid Z_{i}, \alpha, W) & = \prod_{j=1}^{n_{2}} \alpha_{Z_{i},W_{j}}^{Y_{ij}}(1- \alpha_{Z_{i},W_{j}})^{1-Y_{ij}} \\ - p(Z_{i} = k \mid P_{i}) & = \pi_{i,k} \\ - p(Y_{i,\bullet}\mid Z_{i} = k, \alpha, W) & = \prod_{j=1}^{n_{2}} \prod_{r=1}^{R}\alpha_{k,r}^{\mathbb{1}_{W_{j} = r} Y_{ij}}(1- \alpha_{k,r})^{\mathbb{1}_{W_{j} = r}(1-Y_{ij})} \\ - & = \prod_{r=1}^{R} \alpha_{k,r}^{\sum_{j=1}^{n_{2}}W_{jr}Y_{ij}} (1-\alpha_{k,r})^{\sum_{j=1}^{n_{2}}W_{jr}(1-Y_{ij})} - \end{align*} + W_{j} \sim \Cat_{R}(\tilde{\rho}_{1:R}^j) $$ -En posant $R_{ir}=\sum_{j=1}^{n_{2}}W_{jr}Y_{ij}$ et $F_{ir}=\sum_{j=1}^{n_{2}}W_{jr}(1-Y_{ij})$ on définit les matrices $\mathbf{R}$ et $\mathbf{F}$ qui comptent les succès et échecs par ligne $i$ et groupe $r$. - -Ce qui donne pour les $\tilde{\pi}_{i,k}$ de la posterior: +### Implémentation $$ \begin{align*} -\tilde{\pi}_{i,k} = p(Z_{i} = k\mid Y_{i,\bullet},\alpha,W,P_{i}) & \propto p(Y_{i,\bullet}\mid Z_{i} = k, \alpha, W, P_{i})p(Z_{i}=k\mid P_{i})\\ -& \propto \pi_{i,k} \prod_{r=1}^{R} \alpha_{k,r}^{R_{ir}}(1-\alpha_{k,r})^{F_{ir}} + \log \tilde{p_{jr}} & = \log \rho_{r} + \sum_{q=1}^{Q} [R_{jq}^{Z} \log\alpha_{q,r} + F_{jq}^W\log{(1-\alpha_{q,r})}] \\ + \tilde{\rho}_{jr} &= \frac{\exp(\log \tilde{p}_{jr} - m_{j})}{\sum_{l=1}^{R}\exp(\log \tilde{p_{jr}}-m_{j})},\quad m_{j} = \max_{l} \log p_{jr} \end{align*} $$ -Et ainsi à la fin : +Ainsi : $$ -Z_{i}\mid P_{i}, Y, W, \alpha \sim \Cat_{K}(\tilde{\pi}_{i,1},\dots, \tilde{\pi}_{i,K}) +\log \tilde{R} = \log(\rho) + \mathbf{R}^Z\log\alpha^{\top} + \mathbf{F}^Z \log(1-\alpha)^{\top} $$ ## Loi de $\alpha \mid Y,Z,W$ diff --git a/Thèse/Projets annexes/Application colBiSBM réseaux d'optimisation de NN.md b/Thèse/Projets annexes/Application colBiSBM réseaux d'optimisation de NN.md new file mode 100644 index 0000000..6adc339 --- /dev/null +++ b/Thèse/Projets annexes/Application colBiSBM réseaux d'optimisation de NN.md @@ -0,0 +1,26 @@ +--- +title: Application colBiSBM réseaux d'optimisation de NN +categories: + - machine learning + - graphes + - colbisbm + - interprétabilité +author: + - Julian Agudelo Acosta + - Louis Lacoste +--- + + +Suite à la discussion avec Julian j'inscris ce que l'on s'est dit. + +# TODO + +- [ ] En attente réception réseaux de Julian + +# Idée principale + +Julian a utilisé la technique #STN pour obtenir des réseaux qui résument l'entraînement de réseaux de neurones. + +Il espère pouvoir en tirer une manière de différencier les réseaux qui auraient mémorisé de ceux qui auraient généralisé. + +**On peut appliquer colSBM sur ces réseaux !** diff --git a/Thèse/Projets annexes/Applications colBiSBM pour impact pratiques agris sur interactions plantes pollinisateurs.md b/Thèse/Projets annexes/Applications colBiSBM pour impact pratiques agris sur interactions plantes pollinisateurs.md new file mode 100644 index 0000000..4c1ce70 --- /dev/null +++ b/Thèse/Projets annexes/Applications colBiSBM pour impact pratiques agris sur interactions plantes pollinisateurs.md @@ -0,0 +1,59 @@ +--- +title: Pour application du modèle colBiSBM sur données interaction PP et pratiques agricoles +categories: + - application + - agricole + - graphe + - collection + - lbm + - sbm +author: + - Louis Lacoste + - Alizée Geffroy + - Jean Cohen +--- + +{{< include /_macros.tex >}} + +# TODO + +- [ ] Écrire un script pour télécharger les données des diverses sources +- [ ] Écrire un script de prétraitement des données pour les mettre au bon format +- [ ] Appliquer colBiSBM sur les réseaux + +# Idée de l'application + +En discutant avec Alizée et grâce aux ressources de la [section "Liens" données par Jean](#liens) possible d'essayer de voir l'impact sur la structure des réseaux plantes-pollinisateurs des pratiques agricoles autour des espaces de pollinisation. + +# Point à éclaircir + +1. Quels réseaux plantes-pollinisateurs choisir, où les trouver ? Besoin de réseaux en France pour la facilité. + +2. Faut-il utiliser les covariables seulement de manière *post-hoc* pour corréler avec le *clustering* de réseaux obtenus ? + +3. Comment encoder les covariables ? +- Est-ce que je les mets sous forme de pourcentage dans un *buffer* (quel rayon ?) comme Jean ? Alors problèmes inhérents aux données compositionnelles mais facilité d'exécution ? +- Quelle distance considérer pour l'impact des pratiques agricoles, distance variables par pollinisateurs en soit ? Besoin de connaissances expertes. +- Besoin d'homogénéiser les échelles ? Ou a minima d'en choisir une ou plusieurs à considérer pour les covariables ? +- Gestion de gros tableaux de données pas simple. +1. **Le temps ???** + +# Liens + +CORINE Land Cover et extraction en R + +Très gros grain : + + et le package de Jean pour l'extraction des *buffers* de types d'utilisation des sols : + + + +Les cartes de données : + +- Carte du Bio et des types de cultures échelle parcelle : + +- Échelle code postal, achat de phytosanitaires : + +- Thèse de Milena Cairo, classification des parcelles selon les pratiques en pesticides : + +- Recensement des parcelles et du type de culture : diff --git a/Thèse/Projets annexes/VGAE avec (Gromov-)Wasserstein.md b/Thèse/Projets annexes/VGAE avec (Gromov-)Wasserstein.md new file mode 100644 index 0000000..b8fd7f9 --- /dev/null +++ b/Thèse/Projets annexes/VGAE avec (Gromov-)Wasserstein.md @@ -0,0 +1,61 @@ +--- +title: Variational Graph AutoEncoder with Wasserstein +categories: + - convolution + - machine learning + - vae + - graphes +author: + - Julian Agudelo Acosta + - Louis Lacoste +--- + +{{< include /_macros.tex >}} + + + +Suite à la discussion avec Julian j'inscris ce que l'on s'est dit. + +# TODO + +- [ ] Mettre au propre mes expés VGAE ⛔ p0n5me 📅 2026-07-01 +- [ ] Discuter avec Julian pour préparer un papier d'études d'archis de VGAE pour #JDSE 📅 2026-07-02 +- [ ] 🔺 AVOIR SOUMIS aux #JDSE avant le **==28 August 2026==** 📅 2026-08-28 + +# Idée principale + +Les VAE avec convolution de graphes (GCN) permettent d'apprendre une représentation latente des noeuds d'un graphe basée sur les interactions entre noeuds. + +**Objectif** : apprendre un même encodeur et donc un espace latent structuré pour clusteriser une collection de réseaux sur la base de la structure. + +*Sous-objectif* : pouvoir prendre en compte des covariables (Fused Wasserstein ?). + +## Principe du VAE: + +Soit $Y$ une matrice d'adjacence (ou de bi-adjacence pour les graphes bipartites), $X$ une matrice de covariables. + +Soit $D_1$ la matrice des degrés en ligne, $D_2$ la matrice des degrés en colonne. + +$\widetilde{Y} = D_1^{-1/2} Y D_2^{-1/2}$ + +**à compléter** + + + +# Apprentissage contrastif + +Puisque l'on voudrait marquer la séparation entre différentes structures de réseaux, on pourrait vouloir faire de l'[apprentissage contrastif pour V(G)AE](https://u9534056.medium.com/an-overview-of-contrastive-learning-fa520f5f2c23). + +## Hypersphère méga cool + +Il faut creuser : forcer les contraintes des *embeddings* à vivre sur la surface d'une hypersphère car, d'après Julian et la littérature, par rapport à un espace euclidien cela permet d'avoir : + +- position latente bornée : stabilisation de l'apprentissage et évite l'explosion dans une ou plusieurs directions. + +- couverture "uniforme" de la sphère : tendance à faciliter l'apprentissage contrastif, avec l'idée de bien séparer les graphes aux structures différentes. + +[Première source](https://www.envisioning.com/vocab/hyperspherical-representation-learning) + + + +Le softmax est remplacée par la loi de von Mises-Fisher. D'après [Wikipédia](https://fr.wikipedia.org/wiki/Loi_de_von_Mises-Fisher#Relation_avec_la_loi_normale) équivalent de la loi normale multivariée à covariance isotrope restreinte à l'hypersphère unité. diff --git a/Thèse/Résolution des problèmes/Problème avec renv.md b/Thèse/Résolution des problèmes/Problème avec renv.md index 32a2fd7..3781fbe 100644 --- a/Thèse/Résolution des problèmes/Problème avec renv.md +++ b/Thèse/Résolution des problèmes/Problème avec renv.md @@ -11,7 +11,7 @@ Le package 'truc' n'as pas Meta/package.rds Il semblerait que j'avais mal spécifié l'option pkgType (peut-être avait-elle sauté pendant la mise à jour, que sais-je ?). Elle était à "both" là où en la changeant en "source", `{renv}` parvient à installer les packages. ```r -option(pkgType = "source") +options(pkgType = "source") renv::restore() ```