Обработка Имени, храняшегося в поле

Тема в разделе "Lotus - Программирование", создана пользователем Dragon108, 9 авг 2010.

  1. Dragon108

    Dragon108 Well-Known Member

    Регистрация:
    19 янв 2010
    Сообщения:
    264
    Симпатии:
    0
    Есть следующая задача.
    В форме документа есть поле, в котором храниться ФИО человека. Необходимо на основе анализа этого ФИО выяснять пол человека. (естественно решено брать имя за основу и плясать от него). Т.е. заводить словарь имен и искать по словарю, и проставлять пол в зависимости от того, в какую категорию имен попадает данное имя.
    Вопрос в следующем: Как лучше всего реализовать этот словарь (На каждое имя заводить документ, или хранить все имена в виде списка в поле ...). Также желательно что бы в последствии по этому словарю быстро работал поиск. (Очень много обрабатываемых документов).
    Заранее Спасибо.
     
  2. morpheus

    morpheus скриптописец

    Регистрация:
    7 авг 2006
    Сообщения:
    3.927
    Симпатии:
    0
    Женя, Саша ;)

    а может пол вычислять из ИНН или просто в карточке оставить поле "пол"
     
  3. Xalet

    Xalet Well-Known Member

    Регистрация:
    8 авг 2008
    Сообщения:
    410
    Симпатии:
    0
    Вообще это к лингвистам... Да и как-то сомневаюсь я, что сделаете 100% правильную распознавалку. Особенно с учетом имен фамилий не русского происхождения...
    +1
     
  4. TIA

    TIA :-)
    Lotus team

    Регистрация:
    15 май 2009
    Сообщения:
    790
    Симпатии:
    0
    Если в одно SUMMARY-поле влезут все имена, то лучше так. Но влезут врятли, т.к. ограничение 32кб. Потому надо комбинацию обоих способов. Группа имён в одном документе, группа в другом и. т.д.
    И вывести эти имена во вьюшку с отображением многозначных полей в разных строках.
     
  5. turumbay

    Регистрация:
    13 мар 2009
    Сообщения:
    625
    Симпатии:
    2
    имхо, более естественно взять последнюю букву отчества. "ч" - муж., "а" - жен.
    по скорости - самое оно. исключения - обработать вручную.
     
  6. lmike

    lmike нет, пердело совершенство
    Команда форума Lotus team

    Регистрация:
    27 авг 2008
    Сообщения:
    6.073
    Симпатии:
    299
    ;) Гадя Петрович Хренова
     
  7. nvyush

    nvyush Lotus team
    Lotus team

    Регистрация:
    22 апр 2009
    Сообщения:
    2.317
    Симпатии:
    0
    А ФИО — это три разных поля или одно с ФИО через пробел? Сталкивался с последним вариантом, причём, не везде поля были заполнены правильно. Например, Иван И. Иванов, Пётр Петров. А китайские (корейские, вьетнамские и т.д.) имена — это вообще песня (типа Ли Си Цын).
     
  8. Dragon108

    Dragon108 Well-Known Member

    Регистрация:
    19 янв 2010
    Сообщения:
    264
    Симпатии:
    0
    Вариант второй (т.е. в одном поле через пробел) ... но имена не всего мира ... в основном русские + ближнее зарубежье (Украина, Белоруссия и т.д.) ... Корея и Вьетнам не входит ;)
     
  9. nvyush

    nvyush Lotus team
    Lotus team

    Регистрация:
    22 апр 2009
    Сообщения:
    2.317
    Симпатии:
    0
    Dragon108
    КМК, наиболее оптимальным будет натравить агента, работающего по принципу, предложенному turumbay ( http://codeby.net/ipb.html?s=&sh...st&p=179839 ) и добавить во все несомнительные документы поле признака пола, сомнительные собрать в папку для ручной обработки.
     
  10. Xalet

    Xalet Well-Known Member

    Регистрация:
    8 авг 2008
    Сообщения:
    410
    Симпатии:
    0
    И это далеко не все варианты... А еще там может и не быть имени вообще, как вариант. Или фамилии... В общем сочувствую...
     
  11. wowa

    wowa Well-Known Member

    Регистрация:
    1 фев 2007
    Сообщения:
    842
    Симпатии:
    0
    А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)

    Помоему это лучший вариант
     
  12. Medevic

    Medevic Что это ? :)
    Lotus team

    Регистрация:
    10 дек 2004
    Сообщения:
    3.346
    Симпатии:
    2
    Это в какой организации используются уменьшительные формы? Генеральный директор Санёк. А чо? :D
     
  13. Dragon108

    Dragon108 Well-Known Member

    Регистрация:
    19 янв 2010
    Сообщения:
    264
    Симпатии:
    0

    :D +1 "Санек, а чо? есть чо?"


    Нет, имена все таки: Анастасия, Елена, Вячеслав и т.д.
     
  14. wowa

    wowa Well-Known Member

    Регистрация:
    1 фев 2007
    Сообщения:
    842
    Симпатии:
    0
    Medevic, четко подмечено...
    Только если в вышеуказанных вариантах написано что имен может вообще не быть, то лучше быть Саньком, чем "Эй ты, как тебя там" ;)
     
  15. TIA

    TIA :-)
    Lotus team

    Регистрация:
    15 май 2009
    Сообщения:
    790
    Симпатии:
    0
    Это в какой такой стране есть мужские имена Настя и Лена? :)
     
  16. nvyush

    nvyush Lotus team
    Lotus team

    Регистрация:
    22 апр 2009
    Сообщения:
    2.317
    Симпатии:
    0
    Настя — например, Анастас Микоян.
    Лена — возможно, имелся ввиду Леня (Леонид).

    Добавлено:
    Если речь идёт об адресной книге, то альтернативных имён вполне может и не быть.
     
  17. wowa

    wowa Well-Known Member

    Регистрация:
    1 фев 2007
    Сообщения:
    842
    Симпатии:
    0
    куча таких примеров, особенно Чехия, Словения, Словакия...
    Есть даже женские имена Владимира и т.д.

    Чтобы далеко за примером не бегать, один из любимых футболистов, посмотри в википедии футболиста Настя Чех.
    В Македонии есть футболист Лена Ниязи.
    заметь, Настя , а не Анастас :))

    Эт я так, на память привел примеры. А таких примеров очень много.
     
  18. TIA

    TIA :-)
    Lotus team

    Регистрация:
    15 май 2009
    Сообщения:
    790
    Симпатии:
    0
    Ясно. А то я уж испугался за ближнее зарубежье. :)
     
  19. Dragon108

    Dragon108 Well-Known Member

    Регистрация:
    19 янв 2010
    Сообщения:
    264
    Симпатии:
    0
    Вкратце решено было сделать следующее:
    1. Брать значение из поля ФИО

    2. Разбивать его на три элемента массива (фамилия, имя и отчество - соответственно)

    3. Смотреть сколько элементов а массиве: 3 элемента - анализировать по последней букве в отчестве (как предлагалось выше), 2 элемента - осуществлять поиск по "словарям имен". Реализованы они, как сказано вот здесь (ссылка), т.е. имеются вью мужских и женских имен, по которым осуществляется поиск.
     
  20. Xalet

    Xalet Well-Known Member

    Регистрация:
    8 авг 2008
    Сообщения:
    410
    Симпатии:
    0
    Вот мне интересно, а кто у вас даст 100% гарантию, что порядок будет соблюден и что сокращений не будет?

    ЗЫ Практика показывает, что если что-то можно ввести с ошибкой, оно кем-то обязательно с ошибкой и будет введено.
     
Загрузка...
Похожие Темы - Обработка Имени храняшегося
  1. kolka
    Ответов:
    6
    Просмотров:
    251
  2. anna
    Ответов:
    9
    Просмотров:
    881
  3. FaRReLL
    Ответов:
    0
    Просмотров:
    867
  4. crow1986
    Ответов:
    8
    Просмотров:
    1.871
  5. Dazzel
    Ответов:
    1
    Просмотров:
    948

Поделиться этой страницей