запись смысла текста и структура понятийного множества БД

  • Автор темы tar729
  • Дата начала
T

tar729

#1
Для того, чтобы создать словарь в БД морфологический, достаточно построить элементарную БД по принципу любого словаря, т.е. классифицировать по буквам в порядке их расположения в алфавите. Но вот для того, чтобы записать смысл этих понятий, придется делать совсем другую структуру БД, вот такую упрощенно:





Дело в том, что смысл слова мы будем кодировать координатой расположения этого слова в этой БД, а смысл фразы, состоящей из последовательности слов, будем кодировать последовательной записью координат слов через запятую:

С//сущ/собств/ед число/имен. падеж/маша, С//глагол/наст вр/любит, С//сущ/собств/ед число/род. падеж/петю.



получилось:
Маша любит Петю


Т.е. смысл оказался записан в форме записи данных, хранящихся в указанной структуре.

Если перетусовать местами координаты, то смысл не измениться в этом примере, получиться, что "Петю любит Маша" или "любит Маша Петю" или "Маша Петю любит". А вот если взять более сложный пример, то смысл может сказиться до неузнавамости. Скажем, такая фраза:

"Маша не любит Петю".

Если поменять местами слова, то получиться

"Маша не Петю любит"

Т.е. если в первом случае мы поняли, что Маша не любит Петю, то во втором случае мы понимаем, что Маша все таки, кого то любит, но к сожалению не Петю. Т.е. смысл изменился.

Или вот еще пример:

"Петя сказал, что Слава д у р а к"

Поменяем местами координаты Пети и Славы, и получиться, что зачинщик драки не Петя, а Слава, и виноват он.

А если взять пример со знаками препинания, то смысл может тоже стать противоположным:
"казнить нельзя, помиловать"
"казнить, нельзя помиловать"


Можно присвоить каждому понятию боле удобные координаты в виде чисел. Теперь этот смысл можно обрабатывать. Можно применять эту технологию в Гугле или Яндексе и обрабатывать слова не морфологически, а семантически, разбирая строку запроса пользоватля ПО СМЫСЛУ.


Примечательно, что до такой элементарной вещи додумался, похоже, только я один.

Хочется сказать, что подобным образом, хотя и более сложным, можно хранить в БД шаблоны зрительных образов и применять эту технологию для распознавания смыслового содержания картинок, а не по тегам к ним, как сейчас практикуется.
Гугл запатентовал недавно технологию в этой области, но она настолько приметивна, что не идет ни в какое сравнение с предлагаемой.
http://www.widenet.ru/software/google-vvod...nta-na-youtube/

т.е. речь идет о распознавании надписей на картинках всего лишь, в то время, как я предлагаю гораздо большее-распознавание того, что изображено на картинках, вплоть до идентификации личности по фотографии.
 
P

Pasha

#2
tar729
Отлично, ты предложил записывать смысл фразы в некотором формате. Вот только твоя мегатехнология никак не решает проблему ранжирования. Например, пользователь вводит фразу "Маша любит Петю?". В базе есть записи "Маша не любит Петю" и "Маша не Петю любит". Какую из 2-х нужно показать пользователю? А без ранжирования эффект будет такой же, как он простого поиска слов "Маша", "любит", "Петю".
 
T

tar729

#3
я просто ее не описывал здесь, эту технологию...
это вершина айзберга...дальше идет довольно сложная инфраструктура, для ее восприятия нужно вас еще довести...

почитайте пока вот это
http://www.gotai.net/forum/Default.aspx?postid=7926#7926

"В базе есть записи "Маша не любит Петю" и "Маша не Петю любит". Какую из 2-х нужно показать пользователю? А без ранжирования эффект будет такой же, как он простого поиска слов "Маша", "любит", "Петю"."

по запросу "Маша любит Петю?"



система не выдаст релевантной выдачи (относительно субъекта пославшего запрос), поскольку не сможет определить как ранжировать.


для этого нужна вторая строка запроса: цель поиска.


Только тогда будет работать механизм ранжирования.


вообще, даже если делать одну строку запроса, то цель поиска придется назначить по весовым коэффициентам.


система из 2-х строк значительно сокращает программу обработки. Если говорить о прикладной задаче для поисковика, то нужно начинать с 2-х строк запроса. так много легче обкатать технологию.
но об этом позже.
 
P

Pasha

#4
tar729
Почитал по ссылке. Там задали тот же вопрос, ты на него не ответил.
для этого нужна вторая строка запроса: цель поиска.
И как она должна выглядеть? Где пример?
система из 2-х строк значительно сокращает программу обработки. Если говорить о прикладной задаче для поисковика, то нужно начинать с 2-х строк запроса. так много легче обкатать технологию.
но об этом позже.
Вот и наступило долгожданное попозже. Судя по куче текста по ссылке, система просто не способна определить расстояние между двумя фразами. И не способна ранжировать.
 
T

tar729

#5
"И как она должна выглядеть? Где пример?"

1) лена
2) [мат]


система выдаст всех путан


"Судя по куче текста по ссылке, система просто не способна определить расстояние между двумя фразами. И не способна ранжировать."
там вообще этот вопрос не обсуждался.

И еще. я не предлагаю конкретных алгоритмов, я создаю методики их создания.



Эта тема создана не для обсуждения способов ранжирования, на то будет отдельная тема если пожелаете. Позже.
 
T

tar729

#6
смысл- составная вещь, она появляется и интерпретируется только системой.
координаты без триплетов смысла не имеют, но логические причинно-следственные отношения (картинка как раз их и отображает. Это как соединения в электрической схеме) находятся внутри структуры(точнее, представляет собой ее), их не нужно передавать во вне, достаточно передать координаты в машину (или человеку), у которой та же структура, чтобы быть понятым.
 
P

Pasha

#7
tar729
Вот когда придумаешь ранжировние, и перестанешь материться на каждом шагу, тогда и приходи.
 
T

tar729

#8
всякая коммерческая задача, прежде, чем быть реализованной, требует идеи и общей методики, а уже потом конкретной реализации по этой методике.

создание методик, это труд, который могут делать единицы, поскольку этот труд требует наличия определенных способностей, а именно:
владение сравнительным анализом, дедуктивный метод поиска и отбраковка ложных концепций методом исключения.

Моя работа-создавать методики.
Работа программистов-применять эти методики.

Не надо т ребовать от создателя методики конкретных решений, это ваша компетенция.

Если у вас есть вопросы по методике, то задавайте их в методологическом ключе.

что касается ранжирования, то и здесь есть свои методы, и они тоже проработаны.
 
P

Pasha

#9
всякая коммерческая задача, прежде, чем быть реализованной, требует идеи и общей методики, а уже потом конкретной реализации по этой методике.
С другой стороны, всякая методика должна решать вполне конкретную задачу, и предоставлять Proof of Concepts. Твоя "методика" сейчас никакую задачу не решает, и доказательств решения не предоставляет. И вообще весь бред из твоего первого поста сводится к "представим фразу в виде дерева, но не ради эксперимента, а просто так, позырить".
создание методик, это труд, который могут делать единицы, поскольку этот труд требует наличия определенных способностей, а именно:
владение сравнительным анализом, дедуктивный метод поиска и отбраковка ложных концепций методом исключения.
У тебя эти способности есть, а у нас ес-но нет. Тебе кто-то сказал, что ты самый умный, или ты сам так решил?
Не надо т ребовать от создателя методики конкретных решений, это ваша компетенция.
Да ты, создатель, даже задачу решаемую своим созданием не можешь определить. Поэтому явно не тебе определять нашу компетенцию.
Если у вас есть вопросы по методике, то задавайте их в методологическом ключе.
Ок, вот тебе вопрос в методологическом ключе: опиши методологию построения результата поиска по строке запроса. Такая тривиальная задача по силам твоему гению?
что касается ранжирования, то и здесь есть свои методы, и они тоже проработаны.
И где результаты "проработок"? Ссылку, пожалуйста.
 
T

tar729

#10
С другой стороны, всякая методика должна решать вполне конкретную задачу, и предоставлять Proof of Concepts. Твоя "методика" сейчас никакую задачу не решает, и доказательств решения не предоставляет.

методика и не должна предоставлять доказательств решения.

вы плохо понимаете что такое методика.
доказательством является опыт реализации.

"И вообще весь бред из твоего первого поста сводится к "представим фразу в виде дерева, но не ради эксперимента, а просто так, позырить"."


"У тебя эти способности есть, а у нас ес-но нет. Тебе кто-то сказал, что ты самый умный, или ты сам так решил?"

у меня другой тип мышления. А вы считаете, что то, который у вас, единственный из вообще возможных.


"Да ты, создатель, даже задачу решаемую своим созданием не можешь определить."

Ты просто ее не видишь. Задача состоит в том, чтобы создать программу, которая понимает смысл фразы также, как ее понимает человек.
Твои обвинения, модератор, беспочвенны.

"Поэтому явно не тебе определять нашу компетенцию."

ты в этом мало что смыслишь.

"Ок, вот тебе вопрос в методологическом ключе: опиши методологию построения результата поиска по строке запроса. Такая тривиальная задача по силам твоему гению?"

Задачи ставлю я, вы их решаете.



Методика-это набор некоторых алгоритмических указаний в общем виде, определяющих вектор движения для достижения цели.

Создание методик основывается на гипотезах. Далее происходит сравнительный анализ тех методов, оторые удовлетворяют гипотезе, и методом исключения, отбрасываются ложные пути достижения конечной цели. В результате остается наиболее подходящие методы.

Создание гипотез основывается на дедуктивном анализе от общего к частному, при этом сравнительным анализом охватывается весьма широкий объем данных из разных научных направлений.
При создании данной гипотезы, были обобщены теоретические и практические данные из:
Нейробиологии, математики, квантовой физики, психологии, теории систем, булевой алгебры, химии, семантики, теории вероятности.
Хочу заметить, что подобный охват столь значительного количества наук в одном обобщающем анализе, доступен очень немногим людям. Детерменированные причинно-следственные цепочки, связывающие эти науки между собой в контексте некоторой обозначенной проблемы, может найти только человек, обладающий ярко выраженным типом понятийного множества из 2-х возможных вариантов.
К сожалению, цивилизация в последнее время, не востребует данный тип мышления и по объективным причинам доминирует полярный тип структуры, который еще называют математическим, или символьным типом мышления.
Этот тип мышления обладает рядом свойственных этому типу преимуществ, среди которых высокая скорость обработки информации по шаблонам, способность реализовывать узкоспециализированные прикладные проекты и доводить их до коммерческого продукта. Собственно, все это и культивируется системой образования, обеспечивая цивилизации весьма внушительный техногенный прорыв.
Однако, крен, допущенный цивилизацией в штамповании людей с подобным типом мышления, привел к застою в фундамнтальных науках, которая всегда развивалась за счет людей полярного типа, обладающих не символьным, а физическим типом мышления.

Чем же отличается один тип от другого в своей структуре?

Для того, чтобы это понять, нужно принять некоторые объективные физические ограничения:
1) Производительность (число возможных логических операций в еденицу времени) современного мозга есть величина примерно постоянная для среднестатистического индивидуума, и определенна геномом (в части скорости работы нейронов), размером черепной коробки и количеством нейронов в ней.
2) В зависимости от типа задачь, на подсознательном уровне, применяются разные алгоритмы, которые могут влиять на скорость выполнения этих задачь.
3) Тип применяемого алгоритма зависит от структуры упаковки данных в понятийном множестве. Соответственно, один и тот же алгоритм, окажется либо очень медленным, либо вообще неработоспособным в несоответствующей ему структуре БД понятийного множества.

Среднестатистический мозг использует оба возможных типа структуры понятийного множества и применяет универсальный алгоритм работы с обеими структарами, который из за своей сложности и избыточности справляется с задачами общего вида на порядок медленнее, чем алгоритм человека с резко выраженным типом структуры при решении задачь определенного класса (для которорых эта связка: алгоритм-структура) является оптимальной.
При этом оказывается, что обладатели гротескно полярных структур, совершенно не могут решать задачи "не своего" класса, а также, оказываются не в состоянии монять друг друга и на бытовом уровне.
Вечный спор математиков и физиков именно эту причинность и имеет. Им друг друга никогда не удасться понять, и это нормальная ситуация. Выход и симбиоз может быть только в том случае, если физик довериться математику в решении мат задачь, а математик физику, в решении физ. задачь. При этом каждый должен пожертвовать своим самолюбием. В противном случае симбиоз и эффективная связка невозможны.

Но вернемся к рассмотрению самих этих структур их понятийного множества.

Вообще, понятийное множество, это БД. В нейхраняться данные, которые представляют собой некоторую детерминированную триплетную структуру.
Физическое мышление обязано собой структуре, похожей на ту, которую использует компьютер. Т.е. некое дерево, у которого есть корневая папка (диск С://), а далее идут ветки, на которых расположены каталоги и подкаталоги. Отличие от компьютера в том, что каталоги и подкаталоги расположены не абы как, а представляют собой четкую иерархию и место каждого подкаталога в этом дереве назначено причинно-следственной цепочкой, которая связывала образование одних терминов от другимх. Т.е. история образования нового термина по факту их появления в реальности, как бы записана в этой координате.
В такой структуре, каждое понятие в идеале существует в единственном экземпляре и четко зафиксировано координатами в этом дереве. Координатой является путь проводника к этому понятию: С://ЧЧч/шнп/зшогдшр/дрр/дрдорор....., конечное понятие является неотъемлемой частью этой координаты.
Расстояние между жвумя понятиями находиться как время доступа проводника от одного к другому, Т.е. связано с системным таймером. Такой Системный таймер имеется в любом живом организме, но он работает подсознательно. Если бы его не было, то человек не мог бы ощущать течение времени. Кроме того, есть уникальные свидетельства: некоторые люди могут в любой момент сказать вам точное время до секунды, и при этом не иметь с собой часов.
Иногда, понятия расположены в таком дереве очень далеко друг от друга и при мыслительном процессе (синтез словоформ из выборок по понятийному множеству), требуется достаточно много "системных тиков". Это является недостатком подобной структуры понятийного множества. Человек может довольно долго формулировать достаточно банальную и часто применяющуюся фразу (если он ее не запомнил целиком и не положил в специальную папочку в понятийном дереве).


Структура понятийного множества у математиков (берем чисто противоположный и гротескно полярный тип структуры) совсем иная.

В ней понятийное дерево имеет множество корневых папок, а не одну, а само понятийное множество напоминает куст.
Понятия в нем также связаны между собой не по принципу истории их образования из других понятий, а по принципу существования между ними соотношений вообще, т.е. не важно когда понятие появилось и не важно причиной или следствием оно является по отношению к родившему его понятию. Понятия располагаются тем ближе друг от друга (в тех же системных тиках, которые необходимы проводнику), чем чаще они друг с другом применяются. А если они оказываются слишком далеко в структуре, то понятие дублируется, при этом каждому клону приписывается индекс-символ, по которому проводник и отличает клонов друг от друга.
По этой причине математик мыслит очень быстро, гораздо быстрее физика, ведь проводник находит связанные и часто применяемые понятия очень быстро, они просто физически рядом оказываються. Мало того, вместо индексов математик ставит не просто символы, а иногда и целые формулы, например понятие "ток" коих у математика может быть разбросано по дереву с десяток, у одного из них будет индекс u/r, и когда ему понадобиться решать задачу расчета эл. цепи, его проводник моментально выведет к этому понятию с этим индксом, а физик будет долго рыться в понятийном дереве, чтобы сопоставить нужный тэг формулы с понятием эл. тока.
По мере пополнения понятийного множества, математическая структура все время оптимизируется, сокращая расстояния между наиболее часто применяемыми понятиями, т.е. постоянно происходит дефрагментация дискового пространства (в котором физически храниться понятийного множества). Т.е. координаты понятий не стабильны, что приводит математиков к такому казусу по жизни, как подмена понятий, что весьма часто "напрягает" физиков при общении с математиками.
Подобная структура позволяет математикам иметь очень интересную возможность в аналитическом плане.
Поскольку префиксы и индексы представляют часто целые формулы, то аналитический аппарат может напрямую зниматься анализом соот ношений между этипи префиксами, индексами во всем понятийном множестве, т.е. совершенно абстрагируясь от содержательной части, которая заключена во всей последовательности координаты этого понятия в понятийном множестве. Это дает колоссальное увеличение скорости анализа мат закономерностей и физ. явлений, которым соответствют индексы в виде формул.
Но при этом, математик совершенно не может потом объяснить физикам, что же означает его выведенная формула. Именно так математики развили всю квантовую физику, а ее физическое описание, которым они же и занимались выглядит таким ужасным бредом, что понять квантовую физику не могут даже ее отцы основатели, по их же собственным признаниям. Шутка ли сказать, недавно открыли новую частицу спинон, она по мнению математиков состоит из ориентаций. Вот вам пример того, как математики создают в физике новые понятия по своим формулам, пытаясь объяснить, что они означают. В результате элементарных частиц навыдумывали более 600!!!Бритвы оккама им явно не хватает, поскольку скорее всего их на порядок меньше, как минимум, просто математики не увидели связи между ними, что на самом деле они просто рассматривают одну и ту же частицу с разных сторон, а в формуле никак не видно, что она из себя представляет.
Это является основным недостатком математического типа мышления: математик может смотреть на разные формулы как на нечто совершенно разное, которое на самом деле не только может быть прямыми физическими следствием одного из другого, но и вообще представлять собой один и тот же физический процесс.

Физическая структура понятийного множества, лишена этого недостатки более того, обладает очень существенным преимуществом за счет стабильности координат для своих понятий.
Такой человек может видеть статически расположенные объекты, связанные между собой некоторыми причинно следственными связями, как некоторые рисунки, картинки и узоры в том числе и в 3D, которые оказываются характерны для именно этого набора физических отношений. Он может посмотреть на понятийное множесто с топологической стороны и масштабируя искомый графический шаблон, находить похожие "картинки" во всем понятийном множестве, тем самым находить общее физических взаимосвязей в самых разных уголках всего понятийного множества, и самое главное, без труда объяснит что все это означает на пальцах, доходчиво и понятно. Такой охват в физическом плане даже не снился математику, поскольку в таком ракурсе он ограничен очень узким шаблоном, координаты которого более или мнее стабильны, да и то он запутается в трех соснах.

Он может охватить свое понятийное множество только своим инструментом, да и то не все, потому что математик как правило может работать только в узком направлении, он не может быть одновременно химиком, биологом, нейрохирургом и нужные индексы у него в этих местах просто будут отсутствовать, в результате, он не сможет охватить анализом большой участок своего понятийного множества в нужной плоскости поставленной задачи, такой, как например задача искусственного интеллекта.

Но к сожалению, именно математики сейчас пытаються создавать алгоритмы ИИ, и их результаты не утешительны. Я бы сказал, что их практически нет вообще...

Поэтому я вас призываю, обратить внимание на методики, мной предложенные, поскольку в данном направлении я продвинулся слишком глубоко и опередил свое время лет на 20.
Возможено, среди вас найдуться те, кто воспользуется моим советом по поиску возможных вариантов симбиоза полярных людей, профессионалов в своем направлении, и не будет кричать, что то, что я предлагаю-бред. Нужно смириться, что некоторые вещи вы не в состоянии понять по объективным причинам, и что они так навсегда и остануться для вас бредом, пока вы не сделаете при помощи этих методик ИИ...
 
T

tar729

#11
"опиши методологию построения результата поиска по строке запроса."

первая строка-ключевая фраза
2-я строка-цель поиска

по первой строке происходит семантический разбор фразы, определяется смысл сказанного. Если он понимается не однозначно, с недостаточным весовым коэффициентом, то смотриться вторая строка запроса и определяется ее смысл. Используя смысловое содержание цели, корректируется смысловое содержание фразы в первой строке.
Затем, по смыслу с учетом поставленной цели подбирается релевантная выборка из БД поисковика, т.е. из всех возможных вариантов по весовым коэффициентам отбрасываются целые множества выборок. Например, если цель поиска путан, то из выборки выпадут те из них, которые устарели, потому что как правило, путан ищут свежих с вполне конкретной целью. Т.е. алгоритм обработки запроса должен понимать, что в данном случае время является вашным параметром при релевантной выдаче.

А если вы ищите научную информацию, то весовой коэффициент времени не так важен.

Т.е. понимание машиной смысла запроса является ключевым для наивысшей релевантности при выдаче.



вы просили методологическую концептуальную позицию. Вы ее получили. Можено много подробнее, поскольку по мере проработки появляется все больше и больше конкретики.
И она в некоторых местах довольно детально выглядит. Однако
, если вы будете разговаривать со мной недостаточно уважительным тоном, то выничего не получите.

Люди бывают разные, и надо уметь ценить тех, кто может создавать методики.
А я буду ценить тех, кто умеет исать программы. А если вы будете проявлять свою глупость, решая кто из нас умнее, вы не получите ничего. И форумчане тоже. А проблема таки и будет стоять колом.
Поймите, нужно доверяться друг другу, а не вставать в позу. Именно это вы и делаете.


именно так.

в противном случае, вы понимаете термин методика очень узко и в соответствии с вашими стереотипами.
По вашему, гипотезы вообще никакой роли не играют ни в чем.

Есть масса гипотез, к ним относиться модель атома, к примеру, коих около 6. На основании этих гипотез строились МЕТОДИКИ обнаружения молекул, ко Т.е. уже примерно представляли, как должно выглядеть бензольное кольцо, и когда его наконец увидели, то очень быстро идентифицировали.
Вообще, распознавание образов и цель поиска очень связаны.
Если вам не сказать, что в картине Дали есть 2-3 и более скрытых рисунков, вы бы никогда их не обнаружили.


Деньги вперед, пожалуйста :)
к государству вопрос.
я не собираюсь платить за то, что вам делать не интересно. А кому интересно, тот сделает бесплатно и в 20 раз лучше. Вам сколько ни плати, вы ничего не сделаете.

вопрос стоит так.

Вы признаете свою тупость в методиках, я признаю свою тупость в реализации.

в противном случае, создать что то ценное совместно не получиться, а отдельно тем более.


готовы вы на это или не доросли?


вот когда доростете, тогда позовете...
 
T

tar729

#12
Вы, по моему, ваще не понимаете суть "методики".


"Методика - Система правил выполнения какой-н. работы."

система правил ВСЕГДА основываеться на гипотезах.
Например математическая методика основывается на аксиомах математики, большая часть которых взята с потолка, т.е. является гипотезой.

или вот вам еще:

"Система физических аксиом (фундаментальных гипотез )
(добавление в диалектический материализм)."


по гипотезе Эйнштейна, принято, что во всех инерциальных системах скорость света одинакова. Согласно этой гипотезе, существует методика проверки разных экспериментов.

Так что не надо спорить о том, о чем вы спорить не можете. То, как вы понимаете многие вещи, всилу своего математического ума, может быть неверным, и в этом случае, вам следует довериться тому, кто в этом деле знает много больше вашего. И спорить НЕ ПРОДУКТИВНО!


"А я не собираюсь делать, то, за что мне не платят, ку?"

А я разве вас о чем то просил?

Или вы считаете, что все таки как вы и никому проблема искусственного интеллекта не интересна до такой степени, чтобы работать над интересным проектом бесплатно, или хотябы, расчитывая на отдачу в отдаленном будущем?


"Ах вот вы как, ну тогда и я вам скажу - вам скока не объясняй вы всеравно чушь порите, нафик я буду за дарма еще и выделывать ее?"

вс никто ни о чем не просил. на форуме кроме модераторов нет никого чтоли?

"А если не позовем, вы признаете свою некомпетентность?"

по какой причине логически следует это делать интересно?

Это вытекает из аксиомы "здешние модераторы являются наикомпетентнейшими из компетентных в вопросах методик"?

стоит ли напоминать вам, что сие ваша гипотеза?
И методика вашего поведения и отношения ко мне, строиться исходя из этой вашей гипотезы.
смысл уловили?

ну и самомнение у вас, уважаемые. Так вы НИКОГДА ничего путного не сделаете...
 
P

Pasha

#13
tar729
ух какой поток сознания....
методика и не должна предоставлять доказательств решения.

вы плохо понимаете что такое методика.
доказательством является опыт реализации.
...
Ты просто ее не видишь. Задача состоит в том, чтобы создать программу, которая понимает смысл фразы также, как ее понимает человек.
Твои обвинения, модератор, беспочвенны.
Методика-это набор некоторых алгоритмических указаний в общем виде, определяющих вектор движения для достижения цели.
методика - это конкретизация метода, доведение его до инструкции, алгоритма, четкого описания способа сушествования. Она по определению должна создаваться только ради получения инструкции или алгоритма. Твоя "методика" ничего конкретного не предлагает. Поэтому это не методика, а какая-то фигня, описывающая метод "в общем виде".
Задачи ставлю я, вы их решаете.
Нет, все совсем не так. Ты пишешь на форуме шизофренический бред, мы его модерируем. Ты материшься или оскорбляешь других участников - мы тебя баним.
По поводу твоего мегатекста про разные типы мышления: я математик по образованию, но вполне способен общаться с физиками, и понимаю постулаты СТО. Это значит что я опередил тебя по крайней мере лет на 200?
по первой строке происходит семантический разбор фразы, определяется смысл сказанного. Если он понимается не однозначно, с недостаточным весовым коэффициентом, то смотриться вторая строка запроса и определяется ее смысл. Используя смысловое содержание цели, корректируется смысловое содержание фразы в первой строке.
Затем, по смыслу с учетом поставленной цели подбирается релевантная выборка из БД поисковика, т.е. из всех возможных вариантов по весовым коэффициентам отбрасываются целые множества выборок. Например, если цель поиска путан, то из выборки выпадут те из них, которые устарели, потому что как правило, путан ищут свежих с вполне конкретной целью. Т.е. алгоритм обработки запроса должен понимать, что в данном случае время является вашным параметром при релевантной выдаче.
А вот тут, пожалуйста, подробнее. Как ты предлагаешь считать эти самые весовые коэффициенты? Т.е. как ты предлагаешь рассчитывать расстояние между координатами?
Т.е. понимание машиной смысла запроса является ключевым для наивысшей релевантности при выдаче.
Нет, понимания машиной смысла вообще не существует. Для определения релевантности важна способность машины определить разницу в смысле двух фраз - расстояние между их координатами. А методики его определения ты не предлагаешь. Без этой мегаметодики твои идеи бесполезны.
Вы признаете свою тупость в методиках, я признаю свою тупость в реализации.
Нет, ты просто признаешь свою тупость, и неспособность объяснить свои мегаидеи. Вы не вправе претендовать на то, что целиком и полностью в чем-то разбираетесь, если не в состоянии объяснить это своей бабушке. (с) Альберт Эйнштейн. Ты просто нахватался поверхностных знаний, и тебя "осенило". Поработай в этой области пару лет, поймешь что твои "мегаидеи" - обычный велосипед.
вот когда доростете, тогда позовете...
Когда дорАстешь до кнопки "цитата", тогда и возвращайся. Все последующие неотформатированные мессаги будут жэстачайшэ наказываться.
 
P

Pasha

#14
tar729
Чтобы прояснить ситуацию - ты некомпетентен в вопросах ИИ, в вопросах анализа текста, в физики, в математике. А мы компетентны. Поэтому ты ничего не можешь доказать, втираешь нам что методики должны быть абстрактными, провозглашаешь себя гением. Спорить действительно непродуктивно - твоя "методика" не предлагает вообще ничего, но понять ты это не способен. Ведь намного проще обозвать всех вокруг дураками, которые просто не доросли до стоего уровня. Если честно, хоть что-то на основе твоих мегаидей создано? Или до них из всего человечества не дорос вообще никто?