اینستاگرام اطلاعات جدیدی را در مورد نحوه استفاده از یادگیری ماشین برای پیشنهاد محتوا به کاربر ارائه کرده است. برخلاف آنچه تصور می شود این اپ به جای یافتن پست های مجزا، روی پیدا کردن اکانت هایی تمرکز می کند که احتمالا برای کاربر جالب خواهد بود.
اینستاگرام هم مثل بسیاری از شبکه های اجتماعی دیگر به خاطر ارائه محتوای نامناسب از قبیل دروغ پراکنی و تصاویر خشونت آمیز تحت فشار گروه های مختلف قرار دارد. این اپ برای به حاشیه راندن این قبیل مطالب و عدم نمایش آنها در تب اکسپلور از الگوریتم های هوشمند و یادگیری ماشینی استفاده می کند و حالا برای نخستین بار جزییات دقیقی را درباره ساختار آن ارائه کرده است.
اینستاگرام صدها میلیون کاربر دارد که مطالب بسیار متنوعی از خوشنویسی فارسی و عربی گرفته تا سبک زندگی سرخپوست ها را با دیگران به اشتراک می گذارند. اینستاگرام برای غلبه بر این چالش الگوریتم ها را به گونه ای تنظیم کرده که به جای تمرکز روی یافتن یک پست، روی پیدا کردن اکانت هایی تمرکز می کند که ممکن است برای کاربر خوشایند باشند.
شناسایی اکانت های شبیه به هم از طریق یکی از تکنیک های متداول LM به نام word embedding یا درونی سازی واژه ها صورت می گیرد. word embedding برای تشخیص روابط و شباهت های پنهان بین کلمات، آنها را در قالب بردار های عددی نمایانگر کلمات یک لغت نامه در نظر می گیرد.
این تکنیک برای پی بردن به رابطه بین کلمات ترتیب آنها در متن را بررسی می کند. برای مثال واژه هایی مثل آتش و هشدار اغلب کنار هم می آیند اما ارتباطی به کلمات ساندویچ یا پلیکان ندارند. به همین ترتیب الگوریتم قادر است حساب های کاربری مشابه را شناسایی کند.
اکسپلور اینستاگرام برای ارائه پیشنهاد سراغ حساب هایی می رود که کاربر قبلا آنها را مشاهده یا ذخیره کرده است. این موارد به عنوان «اکانت های بذر» در نظر گرفته شده و ۵۰۰ حساب شبیه به آنها شناسایی می شود. این حساب ها پس از فیلتر اسپم ها، اطلاعات نادرست و دیگر موارد نامطلوب بر اساس علایق کاربر مرتب شده و پست های آنها ۲۵ مورد اول به اکسپلور ارسال می شوند
اینستاگرام برای افزایش کارایی اپ خود در حال آموزش مدل های هوش مصنوعی است که محتوایی نظیر اطلاعات نادرست درباره واکسیناسیون را به صورت خودکار شناسایی کرده و اقدامات لازم را انجام می دهند.