اگه بخواهیم الگوریتم برت را به زبان ساده تعریف کنیم، این الگوریتم مدلی از زبان محاوره و روزمره است که به باقی الگوریتم های گوگل کمک میکند تا حتی کوچک ترین بخش های زبان محاوره مثل حروف اضافه را مانند یک انسان به خوبی درک کند.
تعریف الگوریتم برت به زبان خودمانی و محاوره می شود:
آمده تا مفهوم جملات را به درستی متوجه شود و کاربر را به هدف نهایی برساند!
تعریف علمی الگوریتم برت
الگوریتم برت “Bert algorithm”؛ یک مدل پردازش زبان طبیعی (NLP) است که به گوگل کمک می کند تا زبان انسان را بهتر درک کند و به صورت کلی نتایج نزدیکتر به هدف کاربر را نماش دهد.
گوگل در چند سال اخیر روی یک پروژه متن باز (open source) فعالیت می کرد. نام آن BERT بود. دقیقا همان نامی که روی الگوریتم جدیدش گذاشته است.
برت مخفف شده عبارت Bidirectional Encoder Representations from Transformer است. دانستن این معنا و مفهوم ارتباط چندانی به حوزه کاری ما ندارد و بیشتر به هوش مصنوعی برمی گردد. پس بهتر است تا شما تمرکز بیشتری بر نحوه عملکرد آن داشته باشید. همیشه تلاش گوگل این بوده است که بتواند مفهوم عبارت هایی که توسط کاربران جستجو می شود را به درستی درک کند اما این کار برایش بسیار مشکل بوده است.
مکالمه بین دو انسان بسیار پیچیده است. چون هر کسی به یک صورت از حروف اضافه و فعل و فاعل استفاده کرده همچنین همه ی مردم با زبان و لهن خاصی صحبت می کنند. اگر در یک جمله جای فعل و فاعل عوض شود و یا حروف اضافه مثل جمله “رفتن به شمال” و یا “ رفتن از شمال” که در ظاهر فقط دو حرف اضافه مختلف به کار رفته است ولی جملات معنای کاملا متفاوتی دارند. وقتی انسان ها با یکدیگر صحبت میکنند به سادگی این مفاهیم را درک می کنند. ولی وقتی صحبت از ارتباط انسان ها با الگوریتم ها و ماشین ها می شود تشخیص مفهوم کلی جمله برای آن ها بسیار مشکل است.
به همین علت تا چند سال پیش اگر در گوگل یک جمله را جستجو می کردید، گوگل سعی می کرد در پاسخ، آن را به کلمات جداگانه تبدیل کند. به همین دلیل از هر کدام از کلمات جمله یک نتیجه ای به شما نمایش می داد و یا نتایج مشابه با معنی برخی کلمات جمله ما نشان می داد اما الان به این شکل نیست. همین موضوع سبب می شد تا انسان ها برای جست و جو مانند یک ربات عمل کنند! تا بتوانند خودشان را با الگوریتم های گوگل وفق دهند.
اما با گذشت زمان گوگل سعی دارد این ضعف بزرگش را رفع کند مثلا با اضافه کردن جستجوی صوتی. گوگل برای تکمیل الگوریتم های سابق خود الگوریتم برت را معرفی کرد. برت مبتنی بر شبکه عصبی، برای پردازش زبان طبیعی می باشد که به آن (Natural Language Processing) NLP می گویند.
جمع بندی کلی از برت:
- الگوریتم ها میتوانند زبان ما را درست به همان شیوه ای درک کنند که ما از آن استفاده میکنیم.
- الگوریتم های سرچ گوگل میتوانند با درک بهتر زبان ما، کوئری های کاربران را با دقت بیشتری تحلیل کنند. پس با تحلیل کوئری ها می تواند هدف کاربران را به درستی نمایش دهد.
پردازش زبان طبیعی (NLP)
پردازش زبان طبیعی یکی از شاخههای هوش مصنوعی است که به تعاملات بین رایانه و انسان، از طریق زبان طبیعی میپردازد. هدف نهایی NLP، خواندن، رمزگشایی، فهم و درک زبان انسان با روشی ارزشمند است. بیشتر روش های پردازش زبان طبیعی برای استخراج و فهم معنای زبان انسانی، مبتنی بر تکنیکهای یادگیری ماشین است.
پردازش زبان طبیعی در گوگل ترنسلیت، دستیارهای صوتی مانند سیری، ویرایشگرهای متن مثل ورد و … کاربرد دارد.
کامپیوترها می توانند با استفاده از زبان پردازش طبیعی با انسان ها به زبان خودشان صحبت کنند حرف ان ها بفهمند، تحلیل کنند و قسمتهای مهم آن را مشخص نمایند. ماشینهای امروزی می توانند حجم بیشتر از دادههای متنی را در زمان کمتری نسبت به انسان تحلیل کنند. علاوه بر این رایانهها از اشتباه و دیدگاههای متعصبانه نیز دورند. تصور حجم زیاد دادههای متنی که هر روز به خصوص در شبکهای اجتماعی تولید میشوند، ما را وادار به استفاده از پردازش زبان طبیعی میکند.
چالش زبان طبیعی
درک چگونگی همخوانی کلمات با ساختار و معنا ، زمینه مطالعاتی مرتبط با زبانشناسی است. درک زبان طبیعی (NLU) یا همان NLP ، همانطور که در غیر این صورت شناخته شده است، بیش از ۶۰ سال پیش به مقاله اصلی تورینگ تست و تعاریف آنچه AI را تشکیل می دهد و احتمالاً قبل تر از آن برمی گردد.
این زمینه جذاب با مشکلات حل نشده ای روبرو است ، بسیاری از آنها مربوط به ماهیت مبهم زبان (ابهام واژگانی) است. تقریباً هر کلمه دیگر در زبان انگلیسی معانی متعددی دارد.این چالش ها به طور طبیعی به شبکه ای از محتوای روزافزون گسترش می یابد زیرا موتورهای جستجو سعی می کنند هدف را برای تأمین نیازهای اطلاعاتی بیان شده توسط کاربران در پرسش های نوشتاری و گفتاری تفسیر کنند.
ابهام واژگانی
در زبانشناسی ابهام بیش از سطح کلمه در جمله است. کلمات با چندین معنی برای درک جملات و عبارات مبهم با هم دشوارتر می شوند. “ابهام بزرگترین گلوگاه برای کسب دانش محاسباتی ، این مسئله قاتل تمام پردازش های زبان طبیعی است.” مثل کلمه هایی که در فارسی دو معنی دارند در انگلیسی هم همین طور است. همچنین واژه هایی که دارای املای یکسانی هستند و معنای متفاوتی دارند و یا در مثال های انگلیسی به گونه های مختلف هجی می شوند اما هم صدا هستند.
چرا متوجه اپدیت جدید گوگل نشدیم!
در حالی که این الگوریتم در هفته گذشته در جستجو گسترش یافته است، بسیاری از سئوکاران و بسیاری از ابزارهای ردیابی تغییرات گسترده ای در نتایج جستجوی گوگل مشاهده نکرده اند. اما سوال اینجاست چرا؟!
جواب کوتاه این سوال را گوگل در پست وبلاگ خود نوشت: این به روزرسانی BERT واقعاً مربوط به درک سرچ ها و مکالمه طولانی تر و بیشتر بود. ابزارهای ردیابی ، مانند Mozcast و سایر موارد ، در درجه اول کوئری های تری را ردیابی می کنند. این بدان معنی است که تأثیر برت برای این ابزار کمتر قابل مشاهده است.
Moz در BERT: پیت میرز از موز گفت که ابزار MozCast اصطلاحات کوتاه تر را دنبال می کند و نه انواع عباراتی را که احتمالاً به پردازش زبان طبیعی (NLP) BERT نیاز دارند.
چگونه موتورهای جستجو زبان را یاد می گیرند؟
چطور موتورهای جست و جو می توانند این زبان ها را متوجه و درک کنند و هدف کاربر رانمایش دهند؟ در زبانشناسی محاسباتی ، همزمانی این ایده را صادق می داند که کلمات با معانی مشابه یا کلمات مرتبط تمایل دارند به زبان طبیعی بسیار نزدیک به هم زندگی کنند. به عبارت دیگر، آنها تمایل دارند که در جملات و پاراگرافها یا متن متن در مجاورت یکدیگر قرار بگیرند (که بعضاً به آنها گفته می شود).
این رشته از مطالعه روابط و همزمانی واژه ها ، زبان شناسی فرثی نامیده می شود و ریشه های آن معمولاً با زبان شناس دهه ۱۹۵۰ جان فرث پیوند می یابد. در زبانشناسی فرثی، کلمات و مفاهیمی که در فضاهای مجاور متن با هم زندگی می کنند ، مشابه هستند یا به هم مرتبط هستند. مثل کلمه اتوبوس و ماشین که در خانواده وسیله نقلیه هستند.
علی رغم تمام پیشرفت های موتورهای جستجو و زبان شناسان محاسباتی ، رویکردهای بدون نظارت و نیمه نظارتی مانند Word2Vec و Google Pygmalion دارای برخی کاستی هستند که مانع درک مقیاس زبان انسان می شوند.
به راحتی می توان فهمید که چگونه اینها مطمئناً مانع پیشرفت جستجوی مکالمه شده اند. مثلا در تصویر زیر ما گوشی سرچ می کنیم و گوگل به ما پیشنهاداتی میدهد:
بهینه سازی سایت برای الگوریتم برت
برت یک الگوریتم هوش مصنوعی است که دائما در حال یادگیری می باشد. تنها کاری که شما می توانید انجام دهید این است که واقعا برای کاربر نهایی مطلب را بنویسید. برای موفقیت در بهینه سازی شما باید دیدگاه خود را نسبت به کلمات و عبارات کلیدی تغییر دهید. دیگر زمین بازی عوض شده است واستفاده از تکنیک های قدیمی بی فایده است.
روش قبلی سئو کارها برای بهینه سازی سایت به این شکل بود:
- 1- پیدا کردن کلمات کلیدی
- 2- تکرار آن در عنوان ها و متن
اما الان باید به مفهومی که کاربر به دنبال آن است توجه کنید. هر چقدر دقیق تر به دنبال جست و جوهای کاربر باشید موفق تر خواهید شد خوشبختانه این موضوع باعث کاهش استفاده بیش از حد از کلمات کلیدی یا همان keyword stuffing می شود.
یکی از کارهایی که الگوریتم برت به خوبی انجام می دهد پیش بینی هدف جستجو کاربری با درصد خطای پایین است. این یعنی اگر شما یکی از کلمات عبارتی را اشتباه تایپ کنید ولی بقیه کلمات یک مفهوم داشته باشند، گوگل به درستی متوجه منظور شما میشود و در کمال تعجب می بینید در نتایج همان چیزی را به شما نشان میدهد که در ذهن شما بوده ! مثل زمانی که کیبورد شما انگلیسی است و میخواهید فارسی سرچ کنید ولی به اشتباه انگلیسی تایپ می کنید و نتیجه سرچ شما را به درستی نمایش می دهد!
پس میتوانیم اینطور نتیجه بگیریم که:
هدف اصلی الگوریتم BERT، درک بهتر و دقیق تر هدف جستجوی کاربر است.
چه چیزی الگوریتم برت را خاص می کند؟
چندین عنصر وجود دارد که برت را برای جستجو و فراتر از آن بسیار خاص می کند (جهان – بله ، آنقدر بزرگ است که یک پایه تحقیقاتی برای پردازش زبان طبیعی است). چندین ویژگی خاص را می توان یافت:
- دو جهته
- رمزگذار
- نمایش
- تبدیل کننده ها
برت اولین مدل زبان طبیعی کاملاً دو جهته است ، اما این به چه معناست؟ بخشی از گفتار که یک کلمه خاص به آن تعلق دارد می تواند با توسعه جمله به معنای واقعی کلمه تغییر کند. درک واقعی متنی از این قرار است که شما می توانید تمام کلمات یک جمله را همزمان ببینید و بفهمید که چگونه همه کلمات بر متن کلمات دیگر در جمله نیز تأثیر می گذارند. برت قادر است هر دو طرف یک کلمه مورد نظر و کل جمله را به طور هم زمان نگاه کند به گونه ای که انسان به کل متن یک جمله نگاه کند تا اینکه فقط به بخشی از آن جمله نگاه کند. کل جمله ، هر دو چپ و راست یک کلمه هدف را می توان همزمان در متن در نظر گرفت.
تفاوت و شباهت الگوریتم برت و رنک برین
هدف هر دوی این الگوریتم ها درک جست و جوی بهتر کاربران است تا بتوانند بهترین و نزدیک ترین نتایج را به آن ها نشان دهند. این دو الگوریتم توسط Hummingbird کنترل شده و از هوش مصنوعی اسفاده می کنند.
اما تفاوت:
الگوریتم برت بیشتر به دنبال درک زبان طبیعی است ولی الگوریتم رنک برین به دنبال یافتن مفاهیم طولانی و ناشناخته است. اما توجه داشته باشید که برت جایگزین رنک برین نیست در واقع الگوریتم برت یک سیستم افزودنی به سیستم رتبه بندی گوگل و روش اضافه تر برای درک جست و جو است.
پاسخ به سوالات در مورد برت
- آیا الگوریتم برت برای سئو موثر است؟ به طور قطعی نمی توان به این سوال پاسخ داد اما شما باید بیشتر به دنبال نوشتن محتوای مناسب با سرچ کاربر باشید تا با گوگل یک هدف شوید.
- الگوریتم برت همان اپدیت رنک برین است؟ به دلیل ماهیت هوش مصنوعی برت، عده زیادی آن را با رنک برین مقایسه میکنند. با اینکه BERT یک دستاورد در حوزه هوش مصنوعی گوگل است ولی ارتباطی به رنک برین ندارد. در بهترین حالت میتوانیم بگوییم که این دو الگوریتم به عنوان مکمل در کنار هم کار میکنند.
- آیا این الگوریتم گوگل باعث تغییری در مفهوم بازاریابی محتوا می شود؟ وقتی گوگل درک بیشتری از زبان ما پیدا کند، ما هم بهتر میتوانیم محتوای ارزشمند خود را به دست کاربر برسانیم. تنها کاری که باید انجام دهیم این است که برای کاربر و به زبان او محتوا تولید کنیم و اصلاً نگران این نباشیم که گوگل متوجه این حرکت ما نمیشود.
- الگوریتم برت برای چه زبان هایی فعال است؟ بر اساس اعلام گوگل این مدل ابتدا فقط برای کوئری های زبان انگلیسی فعال است ولی به مرور برای تمامی زبان های دنیا مثل زبان فارسی هم اعمال میشود.
- الگوریتم برت همان اپدیت رنک برین است؟ به دلیل ماهیت هوش مصنوعی برت، عده زیادی آن را با رنک برین مقایسه میکنند. با اینکه BERT یک دستاورد در حوزه هوش مصنوعی گوگل است ولی ارتباطی به رنک برین ندارد. در بهترین حالت میتوانیم بگوییم که این دو الگوریتم به عنوان مکمل در کنار هم کار میکنند.
جمع بندی
اگر بخواهیم به جمع بندی کلی الگوریتم برت برسیم باید بگوییم که با توجه به الگوریتم های جدید گوگل باید سعی کنید تا محتوایی کاربرپسند و کلمات کلیدی متناسب با جست و جوی کابران بنویسیم. لزوما محتوای طولانی امتیاز بیشتری در گوگل نمیگیرد محتوایی که تمام نکات سئو و الگوریتم ها را رعایت کند امتیاز بیشتری از گوگل می گیرد پس نیازی نیست مثل گذشته به دنبال محتوای طولانی ، استفاده بیش از حد از کلمات کلیدی و یا سبز شدن چراغ افزونه باشید.
پس تمرکز بیشتر خود را بر روی تولید محتوای کاربر پسند بگذارید. همه ی الگوریتم های گوگل از جمله الگوریتم برت برای درک بهتر هدف کاربر و ساده تر شدن دسترسی به اطلاعات اماده اند پس با رعایت ان ها می توانیم محتوای خود را به نماش همه جهان بگذاریم.
منبع : amanjacademy