График знаний Ответ на вопрос
Опубликовано: 2023-01-25Что такое функция ответа на вопрос в сети знаний Google?
Ответы на вопросы графа знаний (KGQA) занимают много места на страницах результатов поисковых систем (SERP).
Функция ответа на вопросы Google Knowledge Graph отвечает на запросы пользователей, не требуя от них перехода на веб-сайт.
Каждая поисковая система надеется вернуть лучшую информацию, основанную на намерениях искателя. Чтобы быть надежным источником ответов, вы должны быть известны в Интернете. Google понимает потоки запросов и использует их для определения тем и извлечения надежных данных из Интернета для обновления онтологий. Карточки Google, графы знаний (KG) и коллекции знаний — это способ взаимодействия пользователей с Google. Подобно тому, как «люди также задают» вопросы о результатах поиска, ответы на вопросы Knowledge Graph удерживают людей в поисковой выдаче Google дольше.
Оглавление
- Что такое функция ответа на вопрос в сети знаний Google?
- В чем разница между панелями знаний и графами знаний?
- В чем разница между панелями знаний и бизнес-профилями Google?
- В чем разница между панелью знаний Google и хранилищем знаний?
- Отвечая на сложные вопросы с помощью машинного обучения
- Как создать контент с вопросами и ответами, который Google находит полезным
- Диаграммы знаний отвечают на вопросы, связанные с данными
- Шаги для KG Оптимизация ответа на вопрос
- Как запросить обновление панели знаний Google?
- Ответы на вопросы KG стремятся предоставить проверенные знания
Давайте сначала создадим базовый словарь.
В чем разница между панелями знаний и графами знаний?
Графы знаний могут использоваться для предоставления более обширных панелей знаний в результатах поиска и возврата ответов на запросы.
Это помогает рассматривать панели знаний как внешнее проявление сети знаний Google. За тем, что мы видим в данных панельного графика, скрывается больше данных. Как только вы создадите объект сети знаний, Google будет полагаться на него и считать его каноническим источником информации. Технический гигант не изобретал KG как дополнение к пользовательскому опыту на рабочем столе; это был ответ на потребность в более качественных ответах на мобильные запросы. Так много сайтов были (и остаются) ужасными на мобильных устройствах. GKG намеревается предоставить точную информацию своему пользователю; его основная цель не в том, чтобы привлечь трафик на ваш сайт.
Раньше Google не ранжировал веб-страницы на основе точности. Сегодня его специалисты по оценке качества имеют больше инструкций о том, как оценивать опыт, компетентность, авторитетность и надежность (EEAT). Точность ответа — это фактор доверия, и его рекомендации говорят нам, что доверие — самый важный фактор. Напротив, «точность» — это фактор, по которому объекты отображаются в панелях знаний.
Панели знаний — это один из типов расширенных результатов на страницах результатов поиска Google. Они дают поисковикам проверенный обзор информации, связанной с данным объектом.
В чем разница между панелями знаний и бизнес-профилями Google?
Бизнес-профили Google (GBP) выглядят почти так же, как и панели знаний. Фунты стерлингов уникальны для компаний, которые обслуживают клиентов в определенном месте или в пределах обозначенной зоны обслуживания. Доступ в фунтах стерлингов позволяет владельцам бизнеса управлять своим цифровым присутствием на Картах Google и в поиске. Это бесплатно. Напротив, ваша панель знаний Google (GKP) автоматически создается Google с использованием информации о вашей организации в Интернете. Он имеет полный контроль над своим распространением и тем, что он решит обновить в нем.
В чем разница между панелью знаний Google и хранилищем знаний?
Думайте о Хранилище знаний Google (GKV) как о созданном алгоритмом, который генерирует машиночитаемую энциклопедию.
Google добавляет информацию в свой GKV только после того, как убедится, что то, что отображается в панелях знаний, является правильным и полезным. GKV основан исключительно на машинном обучении и машинной логике. Отдельные объекты из нескольких доменов перемещаются в Хранилище знаний только после того, как алгоритм глобальных знаний Google получит достаточную уверенность в понимании указанного объекта.
«…мы представляем Knowledge Vault, вероятностную базу знаний в масштабе Интернета, которая объединяет извлечения из веб-контента (полученные путем анализа текста, табличных данных, структуры страниц и человеческих аннотаций) с предварительными знаниями, полученными из существующих репозиториев знаний. Мы используем контролируемые методы машинного обучения для объединения этих различных источников информации. Хранилище знаний значительно больше, чем любое ранее опубликованное структурированное хранилище знаний, и включает систему вероятностного вывода, которая вычисляет калиброванные вероятности правильности фактов». – Хранилище знаний: веб-подход к вероятностному объединению знаний [1]
Отвечая на сложные вопросы с помощью машинного обучения
Google получает 93% ежедневных запросов. Точно так же, как он традиционно функционирует как поисковая система и заканчивается вашим продуктом или услугой. Чтобы улучшить свои возможности ответа на вопросы, в патенте Google говорится, что: «Обработка естественного языка (NLP) может включать ответы на вопросы на естественном языке на основе информации, содержащейся в документах на естественном языке».
«Описанные методы позволяют отвечать на вопросы на естественном языке, используя методы, основанные на машинном обучении, для сбора и анализа данных из веб-поиска». – [2]
Однако, прежде чем добавлять объекты в свою базу знаний, Google должен сначала алгоритмически понять задаваемый вопрос. Он стремится понять намерение запроса, которое вызвало вопрос. Для неоднозначных запросов семантическая интерпретация помогает ответить на сложные вопросы и стремится воспроизвести человеческое познание. Веб-статьи часто не отображают дату публикации или дату последнего обновления. Напротив, сеть знаний Google постоянно обновляется. Например, я собирался процитировать статью для этого письма, но сначала изучил и увидел «Этой статье больше 3 лет».
По оценкам MarketWatch, «индустрия семантических баз знаний будет стоить 33 миллиарда долларов к 2023 году, а годовой рост составит 10% до конца десятилетия». Его статья от 18 января 2023 г. «Размер рынка семантических знаний, связанный со временем и стоимостью, как ожидается, вырастет в отрасли в ближайшие годы до 2029 г.», включает семантический поиск, машину вопросов и ответов и поиск информации.
Уму непостижимо, насколько рост научных инноваций связан с улучшением KG. В равной степени цифровые маркетологи и SEO-специалисты выигрывают от быстрой адаптации.
KG обычно рассматриваются как крупномасштабные семантические сети, в которых факты хранятся в виде троек в форме (субъект, отношение, объект) или (субъект, атрибут, значение). Ребра в графе представляют отношения между этими сущностями. Большинство KG построены на основе различных существующих источников данных для подключения данных. Пока GPTChat не появился в GPT3, Google не угрожали другие крупные KG, такие как DBpedia, Freebase и YAGO.
Стремление к более гуманным ответам на вопросы
Конкуренция между Goole, OpenAI, Bing и другими достигает беспрецедентных масштабов, чтобы давать более человечные ответы на вопросы, а не просто ссылки на информацию. Google постоянно использует и тестирует различные крупные языковые модели ИИ для улучшения своей поисковой системы и панелей знаний.
Термин «граф знаний» имеет большое родственное семейство; он включает в себя области графов знаний, баз данных графов, хранилищ знаний, панелей знаний, нейронных сетей, машинного обучения, НЛП, искусственного интеллекта, связанных данных, встраивания графов знаний, передачи знаний, передачи обучения, обучения представлению знаний (KRL) и многое другое. ! Трата денег на платный поиск и тривиальные улучшения производительности сайта меркнет по сравнению с эффективным заполнением пробелов в ответах на вопросы. Приведенные ниже рекомендации основаны на моем собственном опыте.
Системы компании, управляемые данными, оцениваются, чтобы установить доверие к научному подходу и его приложениям. Его возможности Knowledge Graph (KG) Question Answering (QA) основаны на сложных структурах данных, которые доступны через интерфейсы на естественном языке.
Как создать контент с вопросами и ответами, который Google находит полезным
Новый оптимизатор понимает, что Google — это тип механизма ответов, и подпитывает его.
Чем больше вы публикуете проверочных данных, тем больше технический гигант может связать данные. Таким образом, вы облегчаете работу поисковой системы в понимании фактов о вашей организации. Вы оказываете помощь, когда связываете свои собственные структурированные данные со всеми различными третьими сторонами, которые говорят о вас. Google не отдает предпочтения тому, связана ли реализация структурированных данных через граф или массив узлов, а не в виде отдельных элементов в отдельных блоках на странице.
- Содержание часто задаваемых вопросов. Ваша компания может создавать базы данных, размеченные схемой, чтобы помочь Google сканировать и обрабатывать информационные страницы вопросов и ответов. Google может выбрать источник часто задаваемых вопросов вашего веб-сайта.
- Тематические кластеры веб-сайтов: информация с четкой онтологией может использоваться для обозначения тематических знаний. Графы знаний организуют объекты, используя веб-данные, которым Google доверяет. Вы можете быть основным источником в различных наборах данных. Таким образом, вы являетесь издателем данных. Если вы заявили права на свою панель знаний, это может быть более надежным и быстрым способом активировать обновление панели знаний.
- Точная база данных продуктов. Пока вы безупречно выполняете работу по обновлению своей базы данных продуктов, вы помогаете Google получить высокую уверенность и доверие к фактам о ваших продуктах. Google с большей уверенностью показывает своим пользователям точную и актуальную информацию, если ваш бренд и продукты в Интернете понятны и непротиворечивы. Будьте последовательны во всем, когда дело доходит до вашего присутствия в Интернете. Используйте то же написание, название, биографию автора, место работы и т. д.
- Загружайте наборы данных изображений: изображения, поступающие из этой конкретной базы данных, могут быть связаны с вашими ответами и заполнять вашу диаграмму знаний. Существование и точность ваших наборов данных по контролю качества продукта помогают обеспечить сопоставимость.
- Используйте разметку схемы FactClaim: результаты поиска Google часто берутся из репозитория Knowledge Graph, содержащего миллиарды фактов о людях, местах и вещах. Включая фактический статистический контент, подтверждающий ваше мнение, вы демонстрируете свою осведомленность и знание соответствующих источников, основанных на фактах.
- Неизменное имя, адрес, телефон. В 2023 году существует больше способов управлять бизнес-профилем Google. Однако ваш NAP является основополагающим для того, как Google идентифицирует вашу организацию. Лучше всего иметь стабильный адрес и использовать адрес, указанный в Google Maps. Графики знаний тесно связаны с Google Maps. Он основан на структурированных данных, структурированной информации в форме согласованности NAP: имя, адрес, номер телефона и то, как они влияют на обновление Google Maps. Такой же тип консистенции обеспечивает GKG.
- Автоматизированные текстовые ответы на часто задаваемые вопросы в профиле Google Business. Вы можете добавлять автоматические ответы на часто задаваемые вопросы прямо в свой бизнес-профиль Google. Он функционирует как автоматизированный двусторонний разговор с ответами на вопросы.
- Внедрите эффективную стратегию Google Post: авторы Google Scholar, известные бренды и выборные должностные лица США не используют возможность заявлять права на свои панели знаний. Это, в свою очередь, предоставляет им доступ к сообщениям Google, что должно быть частью вашей стратегии графа знаний для контента.
- Используйте данные об аудитории и исследования рынка. Первоначальное исследование рынка позволяет получить информацию об аудитории, которая может использоваться в инновационных контент-кампаниях и стратегиях KG. База знаний сначала классифицирует вопросы на основе того, насколько они «значительны» по отношению к намерениям людей.
Подробнее об использовании структурированных данных на вашем веб-сайте:
Райан Леверинг из Google, который в основном работает со структурированными данными, заявил о Mastodon: «Как бы ни выглядел график для всей страницы, это то, что мы используем, независимо от того, откуда он взят. Это смешивается вместе, и хотя известно, откуда оно взялось, это обычно не используется. Тем не менее, предостережение здесь заключается в том, что когда вы делаете это в нескольких блоках, иногда возникают проблемы с конфликтами/дублированием. Кроме того, со временем более богатая/правильная семантика будет отдавать предпочтение более связанным графам. Мы все еще видим случаи, когда люди добавляют несвязанную разметку о вещах (например, о связанных продуктах) на том же верхнем уровне, что и основной объект, из разных блоков на странице, и это в основном создает шум. Так что иногда централизация логики делает ее более последовательной/правильной».
Диаграммы знаний отвечают на вопросы, связанные с данными
Целью графиков является способность функционировать в качестве обоснования терминологии, логики и правильных ответов.
Вот цитата непосредственно из Google о том, как работает его График знаний.
«Результаты поиска Google иногда показывают информацию, полученную из нашей сети знаний, нашей базы данных, содержащей миллиарды фактов о людях, местах и вещах. График знаний позволяет нам ответить на фактические вопросы, такие как «Какова высота Эйфелевой башни?» или «Где проводились летние Олимпийские игры 2016 года». Наша цель с Графом знаний состоит в том, чтобы наши системы обнаруживали и отображали общеизвестную фактическую информацию, когда она определена как полезная». – Как работает График знаний Google
Вы можете наполнить свой График знаний информацией, которая демонстрирует взаимосвязи и концепции, связанные друг с другом. Несмотря на огромные инвестиции в искусственный интеллект чат-ботов, в настоящее время мы знаем, что ему нужна модель предметной области, чтобы понимать вопросы и отвечать на них. Машинное обучение может генерировать огромную базу знаний предложений и вариантов использования, но статический чат-бот имеет ограничения.
Google собирает информацию по определенной теме или предмету, чтобы сначала установить доверие, прежде чем запись в сети знаний данных будет обновлена. Графики помогают нам отвечать на вопросы, связанные с данными, чтобы Google мог легко хранить и извлекать информацию. В основном это сводится к пониманию вопросов, подключению вопросов к вашему графу знаний и выводу ответов.
Предлагаемые шаги по оптимизации ответов на вопросы KG:
- Ищите что, кто, где, почему, а также как публикации, которые вы контролируете.
- Определите, какие внутренние данные QA могут быть получены извне.
- Узнайте, где его найти.
- Узнайте, как он уже используется, кем, как он может быть использован и почему.
- Используйте графики, чтобы определить, как обеспечить большую ценность, анализируя их кластеры, когорты и группы.
- Настройте оповещения, чтобы помочь отслеживать сигналы данных QA, касающиеся контекста, групповых сигналов и динамики внутри и с вашими отношениями сущностей.
- Запланируйте время обслуживания, чтобы управлять и подавать содержимое вашего графа QA.
Обработка естественного языка и управление выравниванием графов облегчают поиск случаев конфликтующих сущностей или определений отношений. Панели, графики и хранилище Google связаны с разрешением сущностей.
Прежде чем ответить на вопрос на платформе, которой вы управляете, сначала разумно поймите вопрос. Вы должны знать намерение искателя и ключевую информацию, необходимую для вопроса. Поисковые системы извлекают ключевую информацию путем поиска именованных сущностей, полезных для включения в граф знаний. Чтобы доверять себе, они избирательны, прежде чем выводить ответ на KG.
Как запросить обновление панели знаний Google?
Google предоставляет своим заявленным владельцам сети знаний способ запрашивать обновления и сообщать о проблемах. Это станет проще, когда вы научитесь давать прямую обратную связь. Его мгновенные ответы регулярно обновляются на основе сканирования Интернета и отзывов пользователей.
«Мы также знаем, что организации, чья информация включена в панели знаний (например, видные деятели или создатели телешоу), являются самостоятельными, и мы предоставляем этим организациям возможность предоставлять прямую обратную связь. Таким образом, часть отображаемой информации может также поступать от проверенных лиц, которые предложили правки фактов в своих собственных панелях знаний. – О панелях знаний
«Мы также получаем фактическую информацию напрямую от владельцев контента различными способами, в том числе от тех, кто предлагает изменения в блоках знаний, на которые они претендуют». – Как работает График знаний Google
Многие считают, что ключевыми преимуществами получения графа семантических знаний является то, что он обеспечивает ясность бренда, восстановление данных и опыт продаж. Но поскольку так много людей задают вопросы, важно также учитывать его способность интегрировать данные и использовать их для предоставления ответов. Что не может быть розничным продавцом, который оказывается ценным таким образом?
Как работает поиск информации с ответами на вопросы?
Google собирает контент кластера вопросов из источников, в которых он может быть уверен.
2023 год — это эпоха улучшения вашей стратегии Графов знаний, поскольку все больше и больше конверсий лидов происходит непосредственно на страницах результатов поисковой системы (SERP). Google оценивает, чему он может доверять в отношении вашей организации, и выбирает, что будет включено в вашу сеть знаний, панели знаний и хранилище знаний. знает о вашей целевой аудитории и клиентах; он стремится объединить ваши сильные стороны и знания в Интернете, чтобы предоставить лучшие ответы. Исследование аудитории и анализ поисковой выдачи могут дать информацию о вашем подходе к маркетингу.
Когда Google извлекает информацию об объектах QA с веб-страниц, определяются оценки ассоциации, включающие эти объекты и их отношения с другими объектами. Он очень заботится о фактических ответах, описывающих свойства этих сущностей. После того, как вы определили свою лучшую маркетинговую стратегию, пришло время перейти к маркетинговой тактике, где вы предприняли определенные маркетинговые действия для улучшения результатов своей поисковой выдачи. Как сегодня, так и тем более в будущем, понимание процесса поиска информации QA и того, как информировать своих KG, является жизненно важным компонентом эффективного SEO.
Из патентов Google мы узнаем, как модель обработки естественного языка может ответить на текстовый вопрос на естественном языке.
«Вычислительная система включает в себя модель обработки естественного языка с машинным обучением, которая включает в себя модель кодировщика, обученную получать текстовое тело на естественном языке и выводить граф знаний, и модель программиста, обученную получать вопрос на естественном языке и выводить программу. Вычислительная система включает в себя машиночитаемый носитель, хранящий инструкции, выполнение которых заставляет процессор выполнять операции. Операции включают в себя получение тела текста на естественном языке, ввод тела текста на естественном языке в модель кодировщика, получение на выходе модели кодировщика графа знаний, получение вопроса на естественном языке, ввод вопроса на естественном языке в модель программиста. , получая программу в качестве вывода модели программиста и выполняя программу на графе знаний, чтобы получить ответ на вопрос о естественном языке». - Обработка естественного языка с помощью машины N-грамм, номер патента: WO2019083519A1, дата публикации: 2 мая 2019 г. [3]
Оценка релевантности сети знаний
Объедините машинное обучение с графиками данных, чтобы связать контекст вопроса аудитории с вашими ответами. Оценка релевантности Google KG использует предварительно обученный LM для оценки узлов в KG, обусловленных ответом на вопрос. Google имеет общую структуру для взвешивания информации в своих KG. Его машинное обучение использует совместные рассуждения над текстом и KG. Таким образом, он связывает контекст вопросов с содержанием ответов, используя LM и графовые нейронные сети.
В целом, Google KG более эффективны и надежны, чем веб-страницы. Так куда это идет?
Ответы на вопросы KG стремятся предоставить проверенные знания
Google Knowledge Graph предоставляет прямые ответы на запросы
Факты, предоставляемые Google Knowledge Graph в ответ на запрос, изначально получены из других источников. (До недавнего времени это было в основном из Википедии и Викиданных). Google прилагает все усилия, чтобы доверять любой информации, содержащейся в его KG. Точное удовлетворение запросов должно быть сложной задачей. Например, чтобы ответить на вопрос «Кто были основателями Google?», Сегмент знаний должен извлечь тройку (подлежащее-сказуемое-дополнение) в соответствии со строками «[Организация], основанная [лицом (лицами)]».
Википедия и Викиданные предоставляют такую точную информацию.
Аарон Брэдли, стратег по графам знаний в Electronic Arts, несколько лет назад задал в Твиттере интересный вопрос. «Например, более важный основной вопрос заключается в том, должны ли мы считать «факты», предоставленные Google Knowledge Graph, фактически правильными (и считает ли сам Google фактически предоставленные Graph «факты)».
Можно быстро понять, почему пользователи должны доверять «ответам» и «фактам», предоставляемым Сеть знаний.
Брэдли продолжает: «Поэтому График должен полагаться на надежность своих источников при определении того, какие утверждения делать. Настолько, что Google обдумал методы улучшения того, как они определяют надежность источника. В конечном счете предоставленное утверждение «откуда-то». И это становится проблематичным, когда полезная нагрузка ответа (особенно голос) не включает информацию о происхождении. И агрегаторы знаний (здесь Google), и пользователи знаний (здесь искатели) должны работать над улучшением того, как мы обрабатываем эти вопросы и ответы». [4]
Ларри Пейдж и Сергей Брин, основатели Google, вновь появились после своего ухода в 2019 году, чтобы пересмотреть стратегию продуктов Google в области искусственного интеллекта. Они одобрили планы и предложили идеи по добавлению новых функций чат-бота в поисковую систему Google. Массовые увольнения сотрудников Google в январе 2023 года последовали за ее новым обязательством поставить ИИ на первое место в своих планах. [5]
Вы можете использовать Google Knowledge Graph Search API для поиска объектов в Google Knowledge Graph. Google Cloud предлагает следующий пример кода разметки схемы: [6]
{ "@контекст": { "@vocab": "http://schema.org/" }, "@type": "Список Элементов", "ЭлементСпискаЭлементов": [ { "результат": { "@id": "c-07xuup16g", "name": "Стэнфордский университет", "description": "Частный университет в Стэнфорде, Калифорния", "Подробное описание": { "articleBody": "Стэнфордский университет, официально Leland Stanford Junior University, является частным исследовательским университетом в Стэнфорде, штат Калифорния. Кампус занимает 8 180 акров, является одним из крупнейших в Соединенных Штатах, и в нем обучается более 17 000 студентов. ", "url": "https://en.wikipedia.org/wiki/Стэнфордский_Университет", "лицензия": "https://en.wikipedia.org/wiki/Википедия:Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License" }, "url": "http://www.stanford.edu/", "изображение": { "contentUrl": "https://encrypted-tbn1.gstatic.com/images?q=tbn:ANd9GcTfPPf-ker0y_892m1wu8-U89furQgQ67foDFncY3r9sREpeWxV", "url": "https://es.wikipedia.org/wiki/Archivo:Logo_of_Stanford_University.png" }, "идентификатор": [ { "@type": "Значение свойства", "propertyID": "googleKgMID", "значение": "/m/06pwq" }, { "@type": "Значение свойства", "propertyID": "googlePlaceID", "значение": "ChIJneqLZyq7j4ARf2j8RBrwzSk" }, { "@type": "Значение свойства", "propertyID": "wikidataQID", "значение": "Q41506" } ], "@тип": [ "Место", "Организация", "Кинотеатр", "Корпорация", «Образовательная организация», "Предмет", "Колледж или университет" ] } } ] }
Мы считаем, что внедрение разметки схемы чрезвычайно полезно. Если вы в двойном, прочитайте нашу статью за и против добавления разметки структурированных данных.
Развитие семантического поиска и GKG
Если эта статья повысит вашу осведомленность в области семантического поиска и графических технологий и теперь вы готовы воспользоваться такими возможностями, позвоните Джинни Хилл по телефону 651-206-2410.
Повысьте свой график личных или деловых знаний, пройдя наш аудит сущностей запросов .
Использованная литература:
[1] https://research.google/pubs/pub45634/
[2] https://patents.google.com/patent/WO2014008272A1/en
[3] https://patentscope.wipo.int/search/en/detail.jsf?docId=WO2019083519
[4] https://mobile.twitter.com/aaranged/status/1108444732282163200
[5] https://searchengineland.com/google-search-chatbot-features-this-year-391977
[6] https://cloud.google.com/enterprise-knowledge-graph/docs/search-api