запись смысла текста и структура понятийного множества БД

Тема в разделе "Общие вопросы", создана пользователем tar729, 20 мар 2008.

  1. tar729

    tar729 Гость

    Для того, чтобы создать словарь в БД морфологический, достаточно построить элементарную БД по принципу любого словаря, т.е. классифицировать по буквам в порядке их расположения в алфавите. Но вот для того, чтобы записать смысл этих понятий, придется делать совсем другую структуру БД, вот такую упрощенно:


    [​IMG]


    Дело в том, что смысл слова мы будем кодировать координатой расположения этого слова в этой БД, а смысл фразы, состоящей из последовательности слов, будем кодировать последовательной записью координат слов через запятую:

    С//сущ/собств/ед число/имен. падеж/маша, С//глагол/наст вр/любит, С//сущ/собств/ед число/род. падеж/петю.



    получилось:
    Маша любит Петю


    Т.е. смысл оказался записан в форме записи данных, хранящихся в указанной структуре.

    Если перетусовать местами координаты, то смысл не измениться в этом примере, получиться, что "Петю любит Маша" или "любит Маша Петю" или "Маша Петю любит". А вот если взять более сложный пример, то смысл может сказиться до неузнавамости. Скажем, такая фраза:

    "Маша не любит Петю".

    Если поменять местами слова, то получиться

    "Маша не Петю любит"

    Т.е. если в первом случае мы поняли, что Маша не любит Петю, то во втором случае мы понимаем, что Маша все таки, кого то любит, но к сожалению не Петю. Т.е. смысл изменился.

    Или вот еще пример:

    "Петя сказал, что Слава д у р а к"

    Поменяем местами координаты Пети и Славы, и получиться, что зачинщик драки не Петя, а Слава, и виноват он.

    А если взять пример со знаками препинания, то смысл может тоже стать противоположным:
    "казнить нельзя, помиловать"
    "казнить, нельзя помиловать"


    Можно присвоить каждому понятию боле удобные координаты в виде чисел. Теперь этот смысл можно обрабатывать. Можно применять эту технологию в Гугле или Яндексе и обрабатывать слова не морфологически, а семантически, разбирая строку запроса пользоватля ПО СМЫСЛУ.


    Примечательно, что до такой элементарной вещи додумался, похоже, только я один.

    Хочется сказать, что подобным образом, хотя и более сложным, можно хранить в БД шаблоны зрительных образов и применять эту технологию для распознавания смыслового содержания картинок, а не по тегам к ним, как сейчас практикуется.
    Гугл запатентовал недавно технологию в этой области, но она настолько приметивна, что не идет ни в какое сравнение с предлагаемой.
    http://www.widenet.ru/software/google-vvod...nta-na-youtube/

    т.е. речь идет о распознавании надписей на картинках всего лишь, в то время, как я предлагаю гораздо большее-распознавание того, что изображено на картинках, вплоть до идентификации личности по фотографии.
     
  2. Pasha

    Pasha Гость

    tar729
    Отлично, ты предложил записывать смысл фразы в некотором формате. Вот только твоя мегатехнология никак не решает проблему ранжирования. Например, пользователь вводит фразу "Маша любит Петю?". В базе есть записи "Маша не любит Петю" и "Маша не Петю любит". Какую из 2-х нужно показать пользователю? А без ранжирования эффект будет такой же, как он простого поиска слов "Маша", "любит", "Петю".
     
  3. tar729

    tar729 Гость

    я просто ее не описывал здесь, эту технологию...
    это вершина айзберга...дальше идет довольно сложная инфраструктура, для ее восприятия нужно вас еще довести...

    почитайте пока вот это
    http://www.gotai.net/forum/Default.aspx?postid=7926#7926

    "В базе есть записи "Маша не любит Петю" и "Маша не Петю любит". Какую из 2-х нужно показать пользователю? А без ранжирования эффект будет такой же, как он простого поиска слов "Маша", "любит", "Петю"."

    по запросу "Маша любит Петю?"



    система не выдаст релевантной выдачи (относительно субъекта пославшего запрос), поскольку не сможет определить как ранжировать.


    для этого нужна вторая строка запроса: цель поиска.


    Только тогда будет работать механизм ранжирования.


    вообще, даже если делать одну строку запроса, то цель поиска придется назначить по весовым коэффициентам.


    система из 2-х строк значительно сокращает программу обработки. Если говорить о прикладной задаче для поисковика, то нужно начинать с 2-х строк запроса. так много легче обкатать технологию.
    но об этом позже.
     
  4. Pasha

    Pasha Гость

    tar729
    Почитал по ссылке. Там задали тот же вопрос, ты на него не ответил.
    И как она должна выглядеть? Где пример?
    Вот и наступило долгожданное попозже. Судя по куче текста по ссылке, система просто не способна определить расстояние между двумя фразами. И не способна ранжировать.
     
  5. tar729

    tar729 Гость

    "И как она должна выглядеть? Где пример?"

    1) лена
    2) [мат]


    система выдаст всех путан


    "Судя по куче текста по ссылке, система просто не способна определить расстояние между двумя фразами. И не способна ранжировать."
    там вообще этот вопрос не обсуждался.

    И еще. я не предлагаю конкретных алгоритмов, я создаю методики их создания.



    Эта тема создана не для обсуждения способов ранжирования, на то будет отдельная тема если пожелаете. Позже.
     
  6. tar729

    tar729 Гость

    смысл- составная вещь, она появляется и интерпретируется только системой.
    координаты без триплетов смысла не имеют, но логические причинно-следственные отношения (картинка как раз их и отображает. Это как соединения в электрической схеме) находятся внутри структуры(точнее, представляет собой ее), их не нужно передавать во вне, достаточно передать координаты в машину (или человеку), у которой та же структура, чтобы быть понятым.
     
  7. Pasha

    Pasha Гость

    tar729
    Вот когда придумаешь ранжировние, и перестанешь материться на каждом шагу, тогда и приходи.
     
  8. tar729

    tar729 Гость

    всякая коммерческая задача, прежде, чем быть реализованной, требует идеи и общей методики, а уже потом конкретной реализации по этой методике.

    создание методик, это труд, который могут делать единицы, поскольку этот труд требует наличия определенных способностей, а именно:
    владение сравнительным анализом, дедуктивный метод поиска и отбраковка ложных концепций методом исключения.

    Моя работа-создавать методики.
    Работа программистов-применять эти методики.

    Не надо т ребовать от создателя методики конкретных решений, это ваша компетенция.

    Если у вас есть вопросы по методике, то задавайте их в методологическом ключе.

    что касается ранжирования, то и здесь есть свои методы, и они тоже проработаны.
     
  9. Pasha

    Pasha Гость

    С другой стороны, всякая методика должна решать вполне конкретную задачу, и предоставлять Proof of Concepts. Твоя "методика" сейчас никакую задачу не решает, и доказательств решения не предоставляет. И вообще весь бред из твоего первого поста сводится к "представим фразу в виде дерева, но не ради эксперимента, а просто так, позырить".
    У тебя эти способности есть, а у нас ес-но нет. Тебе кто-то сказал, что ты самый умный, или ты сам так решил?
    Да ты, создатель, даже задачу решаемую своим созданием не можешь определить. Поэтому явно не тебе определять нашу компетенцию.
    Ок, вот тебе вопрос в методологическом ключе: опиши методологию построения результата поиска по строке запроса. Такая тривиальная задача по силам твоему гению?
    И где результаты "проработок"? Ссылку, пожалуйста.
     
  10. tar729

    tar729 Гость

     
  11. tar729

    tar729 Гость

    "опиши методологию построения результата поиска по строке запроса."

    первая строка-ключевая фраза
    2-я строка-цель поиска

    по первой строке происходит семантический разбор фразы, определяется смысл сказанного. Если он понимается не однозначно, с недостаточным весовым коэффициентом, то смотриться вторая строка запроса и определяется ее смысл. Используя смысловое содержание цели, корректируется смысловое содержание фразы в первой строке.
    Затем, по смыслу с учетом поставленной цели подбирается релевантная выборка из БД поисковика, т.е. из всех возможных вариантов по весовым коэффициентам отбрасываются целые множества выборок. Например, если цель поиска путан, то из выборки выпадут те из них, которые устарели, потому что как правило, путан ищут свежих с вполне конкретной целью. Т.е. алгоритм обработки запроса должен понимать, что в данном случае время является вашным параметром при релевантной выдаче.

    А если вы ищите научную информацию, то весовой коэффициент времени не так важен.

    Т.е. понимание машиной смысла запроса является ключевым для наивысшей релевантности при выдаче.



    вы просили методологическую концептуальную позицию. Вы ее получили. Можено много подробнее, поскольку по мере проработки появляется все больше и больше конкретики.
    И она в некоторых местах довольно детально выглядит. Однако
    , если вы будете разговаривать со мной недостаточно уважительным тоном, то выничего не получите.

    Люди бывают разные, и надо уметь ценить тех, кто может создавать методики.
    А я буду ценить тех, кто умеет исать программы. А если вы будете проявлять свою глупость, решая кто из нас умнее, вы не получите ничего. И форумчане тоже. А проблема таки и будет стоять колом.
    Поймите, нужно доверяться друг другу, а не вставать в позу. Именно это вы и делаете.


    именно так.

    в противном случае, вы понимаете термин методика очень узко и в соответствии с вашими стереотипами.
    По вашему, гипотезы вообще никакой роли не играют ни в чем.

    Есть масса гипотез, к ним относиться модель атома, к примеру, коих около 6. На основании этих гипотез строились МЕТОДИКИ обнаружения молекул, ко Т.е. уже примерно представляли, как должно выглядеть бензольное кольцо, и когда его наконец увидели, то очень быстро идентифицировали.
    Вообще, распознавание образов и цель поиска очень связаны.
    Если вам не сказать, что в картине Дали есть 2-3 и более скрытых рисунков, вы бы никогда их не обнаружили.


    к государству вопрос.
    я не собираюсь платить за то, что вам делать не интересно. А кому интересно, тот сделает бесплатно и в 20 раз лучше. Вам сколько ни плати, вы ничего не сделаете.

    вопрос стоит так.

    Вы признаете свою тупость в методиках, я признаю свою тупость в реализации.

    в противном случае, создать что то ценное совместно не получиться, а отдельно тем более.


    готовы вы на это или не доросли?


    вот когда доростете, тогда позовете...
     
  12. tar729

    tar729 Гость

     
  13. Pasha

    Pasha Гость

    tar729
    ух какой поток сознания....
    методика - это конкретизация метода, доведение его до инструкции, алгоритма, четкого описания способа сушествования. Она по определению должна создаваться только ради получения инструкции или алгоритма. Твоя "методика" ничего конкретного не предлагает. Поэтому это не методика, а какая-то фигня, описывающая метод "в общем виде".
    Нет, все совсем не так. Ты пишешь на форуме шизофренический бред, мы его модерируем. Ты материшься или оскорбляешь других участников - мы тебя баним.
    По поводу твоего мегатекста про разные типы мышления: я математик по образованию, но вполне способен общаться с физиками, и понимаю постулаты СТО. Это значит что я опередил тебя по крайней мере лет на 200?
    А вот тут, пожалуйста, подробнее. Как ты предлагаешь считать эти самые весовые коэффициенты? Т.е. как ты предлагаешь рассчитывать расстояние между координатами?
    Нет, понимания машиной смысла вообще не существует. Для определения релевантности важна способность машины определить разницу в смысле двух фраз - расстояние между их координатами. А методики его определения ты не предлагаешь. Без этой мегаметодики твои идеи бесполезны.
    Нет, ты просто признаешь свою тупость, и неспособность объяснить свои мегаидеи. Вы не вправе претендовать на то, что целиком и полностью в чем-то разбираетесь, если не в состоянии объяснить это своей бабушке. (с) Альберт Эйнштейн. Ты просто нахватался поверхностных знаний, и тебя "осенило". Поработай в этой области пару лет, поймешь что твои "мегаидеи" - обычный велосипед.
    Когда дорАстешь до кнопки "цитата", тогда и возвращайся. Все последующие неотформатированные мессаги будут жэстачайшэ наказываться.
     
  14. Pasha

    Pasha Гость

    tar729
    Чтобы прояснить ситуацию - ты некомпетентен в вопросах ИИ, в вопросах анализа текста, в физики, в математике. А мы компетентны. Поэтому ты ничего не можешь доказать, втираешь нам что методики должны быть абстрактными, провозглашаешь себя гением. Спорить действительно непродуктивно - твоя "методика" не предлагает вообще ничего, но понять ты это не способен. Ведь намного проще обозвать всех вокруг дураками, которые просто не доросли до стоего уровня. Если честно, хоть что-то на основе твоих мегаидей создано? Или до них из всего человечества не дорос вообще никто?
     
  15. tar729

    tar729 Гость

    Модератор: детский сад не тут, думать 3 дня.
     
Загрузка...

Поделиться этой страницей