• 15 апреля стартует «Курс «SQL-injection Master» ©» от команды The Codeby

    За 3 месяца вы пройдете путь от начальных навыков работы с SQL-запросами к базам данных до продвинутых техник. Научитесь находить уязвимости связанные с базами данных, и внедрять произвольный SQL-код в уязвимые приложения.

    На последнюю неделю приходится экзамен, где нужно будет показать свои навыки, взломав ряд уязвимых учебных сайтов, и добыть флаги. Успешно сдавшие экзамен получат сертификат.

    Запись на курс до 25 апреля. Получить промодоступ ...

Обработка Имени, храняшегося в поле

  • Автор темы Dragon108
  • Дата начала
D

Dragon108

Есть следующая задача.
В форме документа есть поле, в котором храниться ФИО человека. Необходимо на основе анализа этого ФИО выяснять пол человека. (естественно решено брать имя за основу и плясать от него). Т.е. заводить словарь имен и искать по словарю, и проставлять пол в зависимости от того, в какую категорию имен попадает данное имя.
Вопрос в следующем: Как лучше всего реализовать этот словарь (На каждое имя заводить документ, или хранить все имена в виде списка в поле ...). Также желательно что бы в последствии по этому словарю быстро работал поиск. (Очень много обрабатываемых документов).
Заранее Спасибо.
 
M

morpheus

Женя, Саша ;)

а может пол вычислять из ИНН или просто в карточке оставить поле "пол"
 
X

Xalet

Вообще это к лингвистам... Да и как-то сомневаюсь я, что сделаете 100% правильную распознавалку. Особенно с учетом имен фамилий не русского происхождения...
а может пол вычислять из ИНН или просто в карточке оставить поле "пол"

+1
 
T

TIA

Если в одно SUMMARY-поле влезут все имена, то лучше так. Но влезут врятли, т.к. ограничение 32кб. Потому надо комбинацию обоих способов. Группа имён в одном документе, группа в другом и. т.д.
И вывести эти имена во вьюшку с отображением многозначных полей в разных строках.
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 941
609
BIT
214
;) Гадя Петрович Хренова
 
N

nvyush

А ФИО — это три разных поля или одно с ФИО через пробел? Сталкивался с последним вариантом, причём, не везде поля были заполнены правильно. Например, Иван И. Иванов, Пётр Петров. А китайские (корейские, вьетнамские и т.д.) имена — это вообще песня (типа Ли Си Цын).
 
D

Dragon108

А ФИО — это три разных поля или одно с ФИО через пробел? Сталкивался с последним вариантом, причём, не везде поля были заполнены правильно. Например, Иван И. Иванов, Пётр Петров. А китайские (корейские, вьетнамские и т.д.) имена — это вообще песня (типа Ли Си Цын).

Вариант второй (т.е. в одном поле через пробел) ... но имена не всего мира ... в основном русские + ближнее зарубежье (Украина, Белоруссия и т.д.) ... Корея и Вьетнам не входит ;)
 
N

nvyush

Dragon108
КМК, наиболее оптимальным будет натравить агента, работающего по принципу, предложенному turumbay ( link removed ) и добавить во все несомнительные документы поле признака пола, сомнительные собрать в папку для ручной обработки.
 
W

wowa

И это далеко не все варианты... А еще там может и не быть имени вообще, как вариант. Или фамилии... В общем сочувствую...
А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)

просто в карточке оставить поле "пол"
Помоему это лучший вариант
 

Medevic

Что это ? :)
Green Team
10.12.2004
3 334
1
BIT
4
А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)
Это в какой организации используются уменьшительные формы? Генеральный директор Санёк. А чо? :D
 
D

Dragon108

Это в какой организации используются уменьшительные формы? Генеральный директор Санёк. А чо? :D


:D +1 "Санек, а чо? есть чо?"


А как вы будете распознавать такие имена: Настя, Лена, Слава..... Эти имена встречаются как у мужчин, так и у женщин. ;)

Нет, имена все таки: Анастасия, Елена, Вячеслав и т.д.
 
W

wowa

Medevic, четко подмечено...
Только если в вышеуказанных вариантах написано что имен может вообще не быть, то лучше быть Саньком, чем "Эй ты, как тебя там" ;)
 
N

nvyush

Это в какой такой стране есть мужские имена Настя и Лена? :)
Настя — например, Анастас Микоян.
Лена — возможно, имелся ввиду Леня (Леонид).

Добавлено:
Medevic, четко подмечено...
Только если в вышеуказанных вариантах написано что имен может вообще не быть, то лучше быть Саньком, чем "Эй ты, как тебя там" :)
Если речь идёт об адресной книге, то альтернативных имён вполне может и не быть.
 
W

wowa

Это в какой такой стране есть мужские имена Настя и Лена?
куча таких примеров, особенно Чехия, Словения, Словакия...
Есть даже женские имена Владимира и т.д.

Чтобы далеко за примером не бегать, один из любимых футболистов, посмотри в википедии футболиста Настя Чех.
В Македонии есть футболист Лена Ниязи.
заметь, Настя , а не Анастас :))

Эт я так, на память привел примеры. А таких примеров очень много.
 
T

TIA

куча таких примеров, особенно Чехия, Словения, Словакия...
Ясно. А то я уж испугался за ближнее зарубежье. :)
но имена не всего мира ... в основном русские + ближнее зарубежье (Украина, Белоруссия и т.д.)
 
D

Dragon108

Вкратце решено было сделать следующее:
1. Брать значение из поля ФИО

2. Разбивать его на три элемента массива (фамилия, имя и отчество - соответственно)

3. Смотреть сколько элементов а массиве: 3 элемента - анализировать по последней букве в отчестве (как предлагалось выше), 2 элемента - осуществлять поиск по "словарям имен". Реализованы они, как сказано вот здесь (ссылка), т.е. имеются вью мужских и женских имен, по которым осуществляется поиск.
 
X

Xalet

2. Разбивать его на три элемента массива (фамилия, имя и отчество - соответственно)

Вот мне интересно, а кто у вас даст 100% гарантию, что порядок будет соблюден и что сокращений не будет?

ЗЫ Практика показывает, что если что-то можно ввести с ошибкой, оно кем-то обязательно с ошибкой и будет введено.
 
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!