Следващата революция в търсачките

Това, което Google направи, беше просто революция в търсачките. Помните ли го тогава с какво търсехме? Търсачките бяха просто бази данни от вкарани на ръка сайтове, като се пресяваха според описанието и заглавието. Google първи въведоха тъй наречените роботи (или crawler), които обикалят сайтове в мрежата и събират информация за съдържанието и връзките им. Ценността на един сайт се оценява на базата на това колко ценни сайтове сочат към него и колко е посещаван. Въз основа на това се изготвя Google PR.

zitgisthome3.gif

Когато някой търси, думите, които написва в търсачката се търсят една по една в съдържанието на сайтовете в базата данни. После се показват сайтовете сортирани по PR. Използването на семантика в търсенето е минимална. Има определени команди, които да ограничат търсенето. Примерно ако напишете „100 USD = ? EUR„, ще ви излезе изчисление по курса за деня.

Ако напишете обаче цял въпрос, ще ви бъде отговорено само ако някой е написал като текст същият въпрос в някой сайт и там има отговор. Обикновено обаче ви препращат към архива на някой mailinglist, в който някой е питал, но никой не му е отговорил. На мен ми се е случвало често, когато търся решението на бъгове в различни api-та.

Идва обаче следващата революция в търсачките. Това не е просто тенденция, а всеобща цел. Към този момент САЩ и Европа се състезават кой първи ще разработи технологията първа. Доколко знам Русия и Япония също имат собствени програми. Става дума за семантичните мрежи – всеки сайт и сървър ще съдържа информацията под формата на онтологии и на базата на нея ще се генерират резултати от повиквания на информационни web services или ще се представя във форма, разбираема за човека, като например сайтове.

top_logo.jpgЗа съжаление тези технологии не са толкова близко. Ще трябва и още време докато собствениците на сайтове ги приложат. Знам това, защото точно с такива технологии работя в момента. За сметка на това, още от сега може да видим как би изглеждала една бъдеща търсачка. True Knowledge е разработена на основата на онтологии. Не знам до колко знанието може да се генерира от сайтове, но доколкото разбирам, основната информация се попълва от посетителите. Нещо като wiki с автоматично проверяване на достоверността.

Удобството на този вид услуга е, че може да зададете въпрос и да получите директен отговор. Той се основава на серия от факти, които се изписват под резултата. И подобно на Google, отдолу ще се появи списък със сайтове с допълнителна информация. Има и api за автоматизиран достъп, като удобството е, че резултата може да се разчете от машина. Ето демото на сайта:

Има много подобни приложения в мрежата. Дори наскоро ми попадна едно на Ontoware, което е базирано на Semantic Wiki. Проблемът с всички тях обаче е, че разчитат на потребителите да попълват знанията. Разликата е, че в този сайт, инструмента за въвеждане на нови факти е силно опростено. Освен това той е първият, който виждам да е направил търсачка с api. За да може да се изпробва, човек трябва да кандидатства за регистрация за бета тестър. Вече се регистрирах и като събера впечатления ще пиша повече.

Източник: techmilk.com zitgist.com

[tags]семантични мрежи, онтологии, революция, true knowledge, google, търсачка[/tags]

13 коментара

  1. Да, правилно си се ориентирал. Тепърва има да се събират пари по семантичните полета 🙂
    А ако можеш да разбереш каква точно е технологията на true knowledge, ще бъде добре. В момента няма конкретна информация.

  2. Мерси за информацията, много полезен пост! Има хляб в тая работа, но има време докато стане реалност.

  3. Наистина има пари в тази сфера, защото малко са специалистите и в един скорошен момент ще има страшен глад за такива. Ще стане малко като Web 2.0 манията. Просто няма да има време достатъчно хора да се преориентират.

    Не е вярно обаче, че ще трябва да се чака докато стане реалност, т.е. докато започне да се прилага. Вярно е, че най-голямата работа ще е изграждането на локалните онтологии и услуги, но още от сега се търсят много знанията. Германия примерно дава милиарди евро за разработки в сферата. Проекта, по който работим е точно с такива пари финансиран.

    @nin: това изглежда същото като true knowledge, но е по-персонализирано. И то може да се използва само с покана. Познаваш ли някой, който вече е вътре?

    @Amantes, това с Google Brain е фалшиво. Реално няма за сега такива разработки. Има само някой симулатори. Сигурен съм обаче, че и те работят усилено в сферата на онтологиите. Надали искат да бъдат изпреварени както M$.

  4. Пълнотекстовото търсене е изестно доста преди Google. Най-популярната търсача преди тях беше Altavista, която също използваше crawlers, за да индексира уеба. Приносът на Лари и Сергей е в Page Rank принципа и използването на anchor text в резултатите от търсене.

    А най-горещия семантичен старт-ап е Powerset. Все още нямат работеща услуга, но канят в онлайн лаба си за тестове на части от технологията. Работи впечатляващо.

  5. Както казах има много подобни услуги. Това, което мен ме интересува повече е технологиите, на които са базирани и инструментите.

    За да имаме обаче истинска семантична мрежа, трябва технологията да се приложи както трябва от всички. Подобно е на SEO – който го прави най-добре, той ще успее. Всъщност това ще е следващият SEO. За целта обаче трябва големите да се разберат за стандартите и да има готови инструменти, с които да се прилагат. Обработването нови знания на естествен език е обещаващо, но най-вероятно няма да е достатъчно мощно средство.

  6. Pingback: Gudasoft の » Blog Archive » Semantic web
  7. Pingback: Открийте това, което наистина ви трябва в интернет с Powerset : IT Отдел
  8. Мерси за информацията, много полезен пост! Има хляб в тая работа, но има време докато стане реалност.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.