Открийте това, което наистина ви трябва в интернет с Powerset


Говоря за следващото поколение търсачки – семантичните. Както писах тук, те са бъдещето не само на търсенето, а и на интернет като цяло, на услугите, които ще получаваме и на общуването като цяло. Досега всички експерименти в тази област бяха в beta фаза, но наскоро Powerset пусна публична търсачка. Участвах в бета тестването и мога да ви кажа, че в сегашната версия има много подобрения.

Нека да ви покажа, какво имам в предвид. Ако потърсите фразата „who ruled Bulgaria“ в Powerset и във Wikipedia, резултатите са следните:

Когато търсите с Google, резултатите са подобни на тези във Wikipedia. В същото време от Powerset получавате конкретни имена на управници и статии за смяната на политически режими. Ако пък напишете „what is bulgaria“, ще ви излязат всякакви определения и събития, които имат връзка със страната ни и това как тя се определя в различен контекст. Тази секция се нарича Factz и издирва всички логически връзки с търсения обект.

С какво е по-добра тази търсачка от Google например? Тайната е в принципа на действие. Когато попитате Google за нещо, той не разпознава, че търсите човек, предмет или статия. Той намира всеки документ, които съдържа най-често комбинацията от думи в търсенето. В такива случаи може да се стигне до кориозни ситуации, в които всъщност думите са пръснати из страницата и тя няма нищо общо с вашите желания, но тъй като сайта е популярен, вие го получавате на първо място.

Powerset от друга страна разбира както търсите. Като напишете „Кой ми е ял от кашата“, търсачката разпознава, че се търси човек и че той е извършвал действието ял/ям“ върху обекта „каша“. Следващата стъпка е да потърси тази логическа връзка в базата си с данни и да върне статии, които логически пасват на търсенето ви, а не само семантично.

Недостатъкът за сега е, че може да се търси само в статии на Wikipedia, защото само те са индексирани. Ако обаче работите често с нея, съм сигурен, че този инструмент ще ви е от голяма полза. Ако пък не – пробвайте го за да усетите как ще изглеждат търсачките след няколко години.

19 коментара

  1. Не е вярно че Google връща сходни резултати, пуснато търсенето без кавички върху уикипедиата, връща много добри резултати – поразгледай първите две страници на Google, има препратки към поне 40 управлявали България, прекалено го подценяваш

  2. а я си представете хибрид между гугъл и Powerset.. 2 в 1 дето се казва..
    чесно казано малко ме побиват тръпки от производното животно и евентуалната му мощ…

  3. Прав си, че като се използват разни трикове на google, може да се намери много повече. Аз виждам обаче два проблема тук. Единия е, че малко хора знаят тези трикове. Втория е, че със всички трикове на нормалните синтактични търсачки може да се достигне едва елементарните търсения на, които са способни семантичните. Примера, който дадох горе е точно такъв.

    Като екстра новите търсачки дават не просто статиите, а обектите, които отговарят на търсенето. В случая това са управниците. Powerset дава и още една екстра – Factz, която предлага логически алтернативи на търсенето – какви договори сме подписвали, какви алианси, войни и т.н.

    Обещанието на семантичните технологии, както писах тук, е не просто по-добри резултати при търсене, а осмисляне на задачата и последователното и изпълнение. Няма да бъде изхвърляне, ако кажа, че с такива технологии даваме мозък на сървърите, който да разбира абстрактни задачи и понятия.

    При Powerset виждаме едва началото на това развитие. Те са добавили и разчитане на естествен език (natural language recognition), който тум се явява мостът между нас и тези нови възможности. Не се съмнявам, че и Google разработват такива неща – в момента Европа и щатите се състезават, кой първи ще ги приложи на практика и ще наложи стандартите си.

  4. Ще дойде и това време. Ако не сварят да развият технологията, просто ще купят някоя компания като тази, която е направила Powerset. Надявам се само да не им порасне егото твърде много и да го използват по грешния начин.

  5. ще е добре да се появи втори голям в търсачките освен Google, това монополно положение им дава доста силен контрол върху трафика, само че потребителите винаги искаме най-доброто(и взимаме най-доброто когато е безплатно), а най-добър обикновено е един продукт

  6. Здравей Боян.
    Има ли частни решения на подобни търсачки и технологии в бизнеса?
    Статиите ти са интерсни и полезни. Може ли да напишеш нещо и за онтологиите и за приложението им в бизнеса в момента.

  7. Не ми е известно да има частни приложения в момента. Всичко е в разработка и повечето са в бета версия. Не очаквам до година да има сериозен продукт на пазара. Бизнеса ще трябва да почака и повече. Проблемът е, че големите компании трябва да инвестират много, за да приложат тези технологии. Не е много ясно на купувачите какво правят и какво са. Дори стандартите са още висящи във въздуха. Въпреки това в щатите от години има наредба, че всяка администрация трябва да изготви онтология, с която да опише дейността си. До колкото ми е известно – единици са направили такава. Просто липсват удобни инструменти и приложения за целта. Друг недостатък е, че трябва да се събират много данни преди да тръгнат смислените резултати. Това за разлика от един интернет сайт, където клиента вижда нещо пред себе си.

    Та не ми е известно да се прилагат много в бизнеса. Може би големите банки, но надали в голяма степен. По принцип най ще са ценни по време на създаване наработен процес, защото лесно ще могат да се откриват интернет услуги и други процеси. Обаче не ми е известно доколко такива инструменти се използват. Нашата фирма е пуснала продукт едва от две години и чак сега излиза същинската функционалност.

  8. С две думи липсват бази данни за извличане на резултати, липсват ясни стандарти и инструментариум за реално прилагане и за сега се ползува wikipedia като източник за подобни демо търсачки. В Америка има няколко експериментални проекта в който потребителите въвеждат снимки, видео и документи а данните се индексират в семантични бази но това са само частни проекти и се чака за да те допуснат ако изобщо те допуснат да тестов акаунт. Какви подобни проекти има в Европа?

  9. само едно ограничение – за да намериш кой ти е ял от кашата, трябва да е имало кой да направи кашата…

  10. @arhivatora – е те затова има програмисти, които работят с отворен код и свободен лиценз.

    @voxy – ще е хубаво и microsoft да ги няма, но не знае кой ще дойде на тяхно място. Винаги трябва да има по един лош. Ей така – за мярка.

  11. Крайно време е за нов начин на търсене в нета. Гугъл напоследък е пълен комерс. Чуден е, ако искаш да разбереш къде на другия край на света да си купиш някоя джаджа. Ако ти трябва обаче техническа информация, софтуер, поддръжка – от 10-та страница натам. Що не си направят една подтърсачка Гугъл Комрес и ако живо ме вълнува от къде да си купя моя ТВ тунер в Сомалия да хода там да си търся.

  12. Всъщност в Google не може да си платиш да излезеш да по-горни позиции. Всичко зависи от това колко е оптимизиран сайта и колко добре е представена информацията. Проблемът е, че рядко притежаването на полезна информация и знанията по SEO се намират в една и съща глава. Така абсолютно безполезна информация се намира супер лесно, защото собственика и й е направил добра реклама.

  13. @ionstorm – google е комерсиален, защото масовите потребители са комерсиални… В сърцето на България масово хората го ползват за търсене на клипове във Vbox7, (не YouTube! Там се говори английски ) и сайтове за запознанства (на локално ниво, както Impulse).Друг съществен елемент от интернет битието на масовия BG потребител е локалната мрежа, която се поддържа най-често от интернет доставчиците.Това нещо не е само в България.За голяма част от хората по света интернет се развива единствено на местно ниво и това определя комерсиалният характер на Google.Големите социални мрежи и широко разпространени интернет услуги за които всички сме чували се толерират основно от хора с малко по-социално развито мислене, които гледат отвъд хоризонта…Другите са потребители.

  14. Прави сте. Просто споделям, че за мен Гугъл от ден на ден става все по-безполезен. Като напиша марка и модел на някоя платка примерно, Гугъл веднага решава че искам да си я купя от къде ли не. Дори да приемем че у нас вече масово се пазарува онлайн, Гугъл пак ще е последното място където ще търся.

  15. Еми в щатите масово се копува online, а и тези магазини имат най-добра SEO. Затова са най-отгоре. Правилото и преди и сега за успешно използване на Google е да се знаят триковете. Това се елеминира при семантичните търсачки. Жалко обаче, че Powersetя купиха microsoft – ще развалят нещата.

  16. Pingback: Бъдещето на Интернет на достъпен език : IT Отдел

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.