L'IA peut vous dire exactement qui vous êtes, même si vous ne le leur dites pas
Même dans les situations où les gens pensent qu’ils n’ont rien divulgué de personnel, les modèles linguistiques de l’IA démontrent un niveau inattendu de compétence dans la compréhension des informations des utilisateurs. Ce phénomène s'explique par une étude récente réalisée par l'École polytechnique fédérale de Zurich. Basée sur des indices obliques, la recherche indique que les réseaux de neurones peuvent créer des profils d'utilisateurs remarquablement précis.
Les chercheurs ont utilisé une publication Reddit accessible au public comme exemple pour leur enquête. L’utilisateur a signalé s’être retrouvé coincé dans la circulation alors qu’il tentait un « crochet » difficile. Sur la base de ces détails apparemment anodins, le modèle linguistique a déduit que l'utilisateur vivait très probablement à Melbourne, en Australie, une ville où ce type d'actions est typique.
Les chercheurs ont créé un ensemble de données en utilisant de vrais profils Reddit et ont découvert que les données actuelles LLM peut déduire avec précision divers attributs personnels, tels que le lieu, le revenu et le sexe. Ces modèles ont atteint une précision allant jusqu'à 85 % pour la première inférence et une précision de 1 % pour la première inférence, le tout à un coût nettement inférieur (95.8 fois) et en moins de temps (3 fois) par rapport aux efforts humains.
Dans un autre exemple, un utilisateur partage que, parce qu’il est célibataire, il a une étrange habitude d’anniversaire de se couvrir de cannelle. Ici, le modèle linguistique estime l'âge de l'auteur à environ 25 ans. Elle vit au Danemark, où il est d'usage de saupoudrer de cannelle les célibataires de 25 ans.
Plusieurs modèles de langage, dont ceux de Google, Meta, OpenAI, et Anthropic, ont été testés dans l’étude. Remarquablement, GPT-4 a fait preuve du plus grand niveau d'expertise, reconnaissant correctement les informations personnelles des utilisateurs dans près de 85 % des cas. Les implications de telles capacités sont sérieusement remises en question par cette révélation.
Les chercheurs ont examiné les mesures de protection de la vie privée courantes, telles que l'anonymisation des textes et l'alignement des modèles, et ont constaté qu'elles étaient actuellement inefficaces en matière de protection. confidentialité de l'utilisateur contre l’inférence LLM. L'étude souligne que les LLM actuels possèdent la capacité de déduire des informations personnelles à une échelle sans précédent. En l’absence de défenses efficaces, les chercheurs soulignent la nécessité d’un débat plus large sur les implications du LLM sur la vie privée, allant au-delà des préoccupations concernant la mémorisation, et s’efforçant de mettre en place des mesures de protection de la vie privée plus complètes.
Bien que ces modèles linguistiques soient de mieux en mieux capables d’interpréter les signaux indirects, les chercheurs pensent qu’en raison de la grande quantité de données de formation qu’ils utilisent, ils pourraient s’avérer des outils extrêmement utiles pour les spécialistes du marketing ou même pour les mauvais acteurs.
- Récemment, Sondage Deloitte de plus de 1,700 22 professionnels révèle un fossé croissant entre l’adoption rapide de l’IA générative et le retard dans le développement de principes éthiques. La confidentialité des données est la principale préoccupation éthique, avec 39 % des personnes interrogées la citant comme leur principale préoccupation. Malgré cela, XNUMX % des personnes interrogées estiment que les technologies cognitives recèlent le plus grand potentiel pour le bien de la société. L’enquête montre également un changement dans les attentes quant à l’implication du gouvernement dans l’établissement de normes technologiques éthiques.
- De plus, la société mère de Snapchat, Snap, est sous surveillance pour les risques liés à la vie privée lié à son chatbot IA, « My AI ». Le Bureau du commissaire à l'information (ICO) du Royaume-Uni a publié un avis d'exécution préliminaire, ce qui pourrait avoir un impact sur les activités de traitement des données de Snap. L'ICO affirme que Snap n'a pas évalué les implications en matière de confidentialité pour les utilisateurs, en particulier les enfants.
Services Connexes: Les leaders de l’IA mettent en garde contre les risques croissants et les préoccupations éthiques liés aux progrès rapides |
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.