Това, което Google направи, беше просто революция в търсачките. Помните ли го тогава с какво търсехме? Търсачките бяха просто бази данни от вкарани на ръка сайтове, като се пресяваха според описанието и заглавието. Google първи въведоха тъй наречените роботи (или crawler), които обикалят сайтове в мрежата и събират информация за съдържанието и връзките им. Ценността на един сайт се оценява на базата на това колко ценни сайтове сочат към него и колко е посещаван. Въз основа на това се изготвя Google PR.
Когато някой търси, думите, които написва в търсачката се търсят една по една в съдържанието на сайтовете в базата данни. После се показват сайтовете сортирани по PR. Използването на семантика в търсенето е минимална. Има определени команди, които да ограничат търсенето. Примерно ако напишете „100 USD = ? EUR„, ще ви излезе изчисление по курса за деня.
Ако напишете обаче цял въпрос, ще ви бъде отговорено само ако някой е написал като текст същият въпрос в някой сайт и там има отговор. Обикновено обаче ви препращат към архива на някой mailinglist, в който някой е питал, но никой не му е отговорил. На мен ми се е случвало често, когато търся решението на бъгове в различни api-та.
Идва обаче следващата революция в търсачките. Това не е просто тенденция, а всеобща цел. Към този момент САЩ и Европа се състезават кой първи ще разработи технологията първа. Доколко знам Русия и Япония също имат собствени програми. Става дума за семантичните мрежи – всеки сайт и сървър ще съдържа информацията под формата на онтологии и на базата на нея ще се генерират резултати от повиквания на информационни web services или ще се представя във форма, разбираема за човека, като например сайтове.
За съжаление тези технологии не са толкова близко. Ще трябва и още време докато собствениците на сайтове ги приложат. Знам това, защото точно с такива технологии работя в момента. За сметка на това, още от сега може да видим как би изглеждала една бъдеща търсачка. True Knowledge е разработена на основата на онтологии. Не знам до колко знанието може да се генерира от сайтове, но доколкото разбирам, основната информация се попълва от посетителите. Нещо като wiki с автоматично проверяване на достоверността.
Удобството на този вид услуга е, че може да зададете въпрос и да получите директен отговор. Той се основава на серия от факти, които се изписват под резултата. И подобно на Google, отдолу ще се появи списък със сайтове с допълнителна информация. Има и api за автоматизиран достъп, като удобството е, че резултата може да се разчете от машина. Ето демото на сайта:
Има много подобни приложения в мрежата. Дори наскоро ми попадна едно на Ontoware, което е базирано на Semantic Wiki. Проблемът с всички тях обаче е, че разчитат на потребителите да попълват знанията. Разликата е, че в този сайт, инструмента за въвеждане на нови факти е силно опростено. Освен това той е първият, който виждам да е направил търсачка с api. За да може да се изпробва, човек трябва да кандидатства за регистрация за бета тестър. Вече се регистрирах и като събера впечатления ще пиша повече.
Източник: techmilk.com zitgist.com
[tags]семантични мрежи, онтологии, революция, true knowledge, google, търсачка[/tags]
Да, правилно си се ориентирал. Тепърва има да се събират пари по семантичните полета 🙂
А ако можеш да разбереш каква точно е технологията на true knowledge, ще бъде добре. В момента няма конкретна информация.
Още една фирма в областта на семантичния уеб:
А това виждал ли си го?
Дали това няма да е бъдещето? 😉
Мерси за информацията, много полезен пост! Има хляб в тая работа, но има време докато стане реалност.
Наистина има пари в тази сфера, защото малко са специалистите и в един скорошен момент ще има страшен глад за такива. Ще стане малко като Web 2.0 манията. Просто няма да има време достатъчно хора да се преориентират.
Не е вярно обаче, че ще трябва да се чака докато стане реалност, т.е. докато започне да се прилага. Вярно е, че най-голямата работа ще е изграждането на локалните онтологии и услуги, но още от сега се търсят много знанията. Германия примерно дава милиарди евро за разработки в сферата. Проекта, по който работим е точно с такива пари финансиран.
@nin: това изглежда същото като true knowledge, но е по-персонализирано. И то може да се използва само с покана. Познаваш ли някой, който вече е вътре?
@Amantes, това с Google Brain е фалшиво. Реално няма за сега такива разработки. Има само някой симулатори. Сигурен съм обаче, че и те работят усилено в сферата на онтологиите. Надали искат да бъдат изпреварени както M$.
Ето и още нещо във връзка със SOA и онтологиите: SOA проектът ми по информатика
Пълнотекстовото търсене е изестно доста преди Google. Най-популярната търсача преди тях беше Altavista, която също използваше crawlers, за да индексира уеба. Приносът на Лари и Сергей е в Page Rank принципа и използването на anchor text в резултатите от търсене.
А най-горещия семантичен старт-ап е Powerset. Все още нямат работеща услуга, но канят в онлайн лаба си за тестове на части от технологията. Работи впечатляващо.
Както казах има много подобни услуги. Това, което мен ме интересува повече е технологиите, на които са базирани и инструментите.
За да имаме обаче истинска семантична мрежа, трябва технологията да се приложи както трябва от всички. Подобно е на SEO – който го прави най-добре, той ще успее. Всъщност това ще е следващият SEO. За целта обаче трябва големите да се разберат за стандартите и да има готови инструменти, с които да се прилагат. Обработването нови знания на естествен език е обещаващо, но най-вероятно няма да е достатъчно мощно средство.
Мерси за информацията, много полезен пост! Има хляб в тая работа, но има време докато стане реалност.