Обработка Имени, храняшегося в поле

  • Автор темы Автор темы Dragon108
  • Дата начала Дата начала
D

Dragon108

Есть следующая задача.
В форме документа есть поле, в котором храниться ФИО человека. Необходимо на основе анализа этого ФИО выяснять пол человека. (естественно решено брать имя за основу и плясать от него). Т.е. заводить словарь имен и искать по словарю, и проставлять пол в зависимости от того, в какую категорию имен попадает данное имя.
Вопрос в следующем: Как лучше всего реализовать этот словарь (На каждое имя заводить документ, или хранить все имена в виде списка в поле ...). Также желательно что бы в последствии по этому словарю быстро работал поиск. (Очень много обрабатываемых документов).
Заранее Спасибо.
 
Женя, Саша ;)

а может пол вычислять из ИНН или просто в карточке оставить поле "пол"
 
Вообще это к лингвистам... Да и как-то сомневаюсь я, что сделаете 100% правильную распознавалку. Особенно с учетом имен фамилий не русского происхождения...
а может пол вычислять из ИНН или просто в карточке оставить поле "пол"

+1
 
Если в одно SUMMARY-поле влезут все имена, то лучше так. Но влезут врятли, т.к. ограничение 32кб. Потому надо комбинацию обоих способов. Группа имён в одном документе, группа в другом и. т.д.
И вывести эти имена во вьюшку с отображением многозначных полей в разных строках.
 
;) Гадя Петрович Хренова
 
А ФИО — это три разных поля или одно с ФИО через пробел? Сталкивался с последним вариантом, причём, не везде поля были заполнены правильно. Например, Иван И. Иванов, Пётр Петров. А китайские (корейские, вьетнамские и т.д.) имена — это вообще песня (типа Ли Си Цын).
 
А ФИО — это три разных поля или одно с ФИО через пробел? Сталкивался с последним вариантом, причём, не везде поля были заполнены правильно. Например, Иван И. Иванов, Пётр Петров. А китайские (корейские, вьетнамские и т.д.) имена — это вообще песня (типа Ли Си Цын).

Вариант второй (т.е. в одном поле через пробел) ... но имена не всего мира ... в основном русские + ближнее зарубежье (Украина, Белоруссия и т.д.) ... Корея и Вьетнам не входит ;)
 
Dragon108
КМК, наиболее оптимальным будет натравить агента, работающего по принципу, предложенному turumbay ( link removed ) и добавить во все несомнительные документы поле признака пола, сомнительные собрать в папку для ручной обработки.
 
И это далеко не все варианты... А еще там может и не быть имени вообще, как вариант. Или фамилии... В общем сочувствую...
А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)

просто в карточке оставить поле "пол"
Помоему это лучший вариант
 
А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)
Это в какой организации используются уменьшительные формы? Генеральный директор Санёк. А чо? :D
 
Это в какой организации используются уменьшительные формы? Генеральный директор Санёк. А чо? :D


:D +1 "Санек, а чо? есть чо?"


А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)

Нет, имена все таки: Анастасия, Елена, Вячеслав и т.д.
 
Medevic, четко подмечено...
Только если в вышеуказанных вариантах написано что имен может вообще не быть, то лучше быть Саньком, чем "Эй ты, как тебя там" ;)
 
Это в какой такой стране есть мужские имена Настя и Лена? :)
Настя — например, Анастас Микоян.
Лена — возможно, имелся ввиду Леня (Леонид).

Добавлено:
Medevic, четко подмечено...
Только если в вышеуказанных вариантах написано что имен может вообще не быть, то лучше быть Саньком, чем "Эй ты, как тебя там" :)
Если речь идёт об адресной книге, то альтернативных имён вполне может и не быть.
 
Это в какой такой стране есть мужские имена Настя и Лена?
куча таких примеров, особенно Чехия, Словения, Словакия...
Есть даже женские имена Владимира и т.д.

Чтобы далеко за примером не бегать, один из любимых футболистов, посмотри в википедии футболиста Настя Чех.
В Македонии есть футболист Лена Ниязи.
заметь, Настя , а не Анастас :))

Эт я так, на память привел примеры. А таких примеров очень много.
 
куча таких примеров, особенно Чехия, Словения, Словакия...
Ясно. А то я уж испугался за ближнее зарубежье. :)
но имена не всего мира ... в основном русские + ближнее зарубежье (Украина, Белоруссия и т.д.)
 
Вкратце решено было сделать следующее:
1. Брать значение из поля ФИО

2. Разбивать его на три элемента массива (фамилия, имя и отчество - соответственно)

3. Смотреть сколько элементов а массиве: 3 элемента - анализировать по последней букве в отчестве (как предлагалось выше), 2 элемента - осуществлять поиск по "словарям имен". Реализованы они, как сказано вот здесь (ссылка), т.е. имеются вью мужских и женских имен, по которым осуществляется поиск.
 
2. Разбивать его на три элемента массива (фамилия, имя и отчество - соответственно)

Вот мне интересно, а кто у вас даст 100% гарантию, что порядок будет соблюден и что сокращений не будет?

ЗЫ Практика показывает, что если что-то можно ввести с ошибкой, оно кем-то обязательно с ошибкой и будет введено.
 
Мы в соцсетях:

Взломай свой первый сервер и прокачай скилл — Начни игру на HackerLab