Je veux des données, beaucoup !


#1

En résumé j’aimerais bien faire des applications d’algos sur les données si l’envie m’en prend. Pour faire par exemple un onglet tendance comme on a vu l’efficacité sur YouTube. Et pour celà il faut des données sur les vues… et même anonymes ça serait intéressant.
Ma question : comment serai géré les données pour faire du traitement ?


#2

Salut @Xavdel!

Ce serait pas mal de pouvoir laisser à l’utilisateur le choix entre plusieurs algorithmes pour gérer sa page d’accueil tant que j’y pense :slight_smile:

Pour autant, on ne parle pas de Big Data. Il ne s’agit pas de récolter un maximum d’information pour savoir quoi en faire uniquement après, à la manière des GAFAMs (un raccourci, mais ça reste pertinent selon moi, voir §4).

Ta question porte sur la gestion des données. Selon moi le contrôle des données devrait au maximum être donné à l’utilisateur, et éloigné du serveur. Ça n’empêche pas de masquer la complexité du traitement, mais c’est une autre histoire car il s’agit bien de gestion dont on parle.

J’imagine que parler de gestion de données est trop abstrait pour réaliser ton projet. Tu te demandes sûrement comment accéder à ces données, où les récolter. Pour pouvoir répondre à cette question il faudrait déterminer sur quelles données tu souhaite faire opérer tes algorithmes.

Ah et sinon les données anonymisées c’est un premier pas, mais c’est aussi possible de dés-anonymiser des données :thinking:


#3

Le machine learning c’est souvent de la bidouille c’est à dire que pour faire un meilleur score on prend toute les données possible qu’on tord dans tous les sens pour avoir des scores correctes.
Si il est vrai que dés-anonymiser est possible pour faire de l’apprentissage automatique il faut énormément de données pour converger à des résultats.
Ça veut pas dire que pour faire un onglet tendance c’est la seul solution car il est toujours possible de faire des algorithmes intelligent mais l’apprentissage automatique à pour lui sa simplicité en échange d’un manque de maîtrise.
La situation c’est que plus on en demande à l’utilisateur plus une partie se perd/abandonnent.
Peut-être permettre à l’utilisateur de partager des données anonymement par une option sur le serveur(option à cocher). Mais comme je participe pas au projet je sais pas les protections des données mises en place.
C’était une idée comme ça, pour la théorie.


#4

Après bien sûr permettre à plus d’algorithmes d’êtres utilisé c’est intéressant mais si ça marche ok 95% vont pas chercher plus loin.