russiannames
1.0.0
russiannames
는 러시아 이름, 성 및 중부 이름을 구문 분석 전용 Python 3 라이브러리로, FullName으로 사람의 성별을 식별하고 이름이 쓰여진 방법. MongoDB를 속도를 높이기위한 백엔드로 사용합니다.
문서화는 자동으로 구축되며 https://russiannames.readthedocs.org/en/latest/에서 찾을 수 있습니다.
Python Library를 설치하려면 pip install russiannames
사용 PIP 또는 python setup.py install
통해 러시아어 이름을 설치하십시오.
데이터베이스를 사용하려면 MongoDB 인스턴스가 필요합니다. https://github.com/datacoon/russiannames/blob/mas
mongorestore
명령을 사용하여 names
데이터베이스를 복원하여 3 개의 컬렉션, 이름, 성 및 미들 이름
식별에 사용되는 이름 데이터베이스
성별 및 수집 별 자세한 데이터베이스 통계
수집 | 총 | 남성 | 안 | 보편적이거나 미확인 |
---|---|---|---|---|
이름 | 32134 | 19297 | 8278 | 1196 |
미들 이름 | 48274 | 30114 | 16143 | 0 |
성 | 375274 | 124662 | 111534 | 38827 |
12 개의 러시아 풀 이름 쓰기 스타일을 지원합니다
체재 | 예 | 설명 |
---|---|---|
에프 | ольга | 이름 만 |
에스 | петров | 성 만 |
FS | о. сидорова | 첫 번째 이름과 전체 성 |
sf | николаев с. | 전체 성과 성의 첫 글자 |
sf | абрамов семен | 전체 성과 전체 이름 |
FS | соня камиулллина | 전체 이름과 전체 성 |
FM | иван петров붕 | 전체 이름과 전체 미들 이름 |
SFM | м. д. 게요. | 성의 첫 글자, 이름, 미들 이름 |
FMS | а. егорова | 첫 번째 및 중간 이름의 첫 글자와 전체 퍼니스 |
SFM | николаенко с.п. | 전체 성과 첫 번째 이름과 중간 이름의 첫 글자 |
SFM | петракова зинаида м. | 전체 성, 이름 및 중간 이름의 첫 글자 |
SFM | казаков ринат артуро폴인 | 성, 이름, 이름 및 중간 이름으로 이름입니다 |
FMS | светлана архиповна волкова | 이름으로 이름, 중간 이름 및 성으로 성입니다 |
다음 민족 식별에 따라 이름을 지원합니다
이름, 성 및 중간 이름의 9 가지 민족 유형이 지원됩니다.
열쇠 | 이름 (en) | 이름 (RUS) |
---|---|---|
아라비아 사람 | 아라비아 말 | арабское |
팔 | 아르메니아 사람 | армянское |
Geor | 그루지야 사람 | грунинское |
세균 | 독일 사람 | нем 게 |
그리스 사람 | 그리스 사람 | гресеские |
유태인 | 유태인 | еврейские |
폴스크 | 광택 | польские |
슬라브 사람 | 슬라브어 (러시아어) | славянские |
터 | 터키 | 셨어요 |
구문 분석 이름 및 반품 : 형식, 성, 이름, 중간 이름, 구문 분석 (True/False) 및 성별
>>> from russiannames.parser import NamesParser
>>> parser = NamesParser()
>>> parser.parse('Нигматуллин Ринат Ахметович')
{'format': 'sfm', 'sn': 'Нигматуллин', 'fn': 'Ринат', 'mn': 'Ахметович', 'gender': 'm', 'text': 'Нигматуллин Ринат Ахметович', 'parsed': True}
>>> parser.parse('Петрова C.Я.')
{'format': 'sFM', 'sn': 'Петрова', 'fn_s': 'C', 'mn_s': 'Я', 'gender': 'f', 'text': 'Петрова C.Я.', 'parsed': True}
성 필드는 다음 가치 중 하나를 가질 수 있습니다.
부문 이름, 이름 및 중간 이름 및 사람의 윤리적 제휴를 식별하려고합니다.
>>> from russiannames.parser import NamesParser
>>> parser = NamesParser()
>>> parser.classify('Нигматуллин', 'Ринат', 'Ахметович')
{'ethnics': ['tur'], 'gender': 'm'}
>>> parser.classify('Алексеева', 'Ольга', 'Ивановна')
{'ethnics': ['slav'], 'gender': 'f'}