8

Пишу авторизацию в приложении и хочется отсечь попытки неадекватных школьников уже на этом этапе вписать в EditText невалидное имя (маты).

Проверку хотел сделать через .contains ArrayList<String>, дак вот после наверное двадцатого элемента фантазия кончилась :) да и не совсем по душе пришлось занятие :)

Поэтому вопрос - может кто уже делал подобную БД и может поделиться (на полный список не рассчитываю по понятным причинам), чтобы просто Ctrl+C, Ctrl+V.

PS. Просьба отнестись с пониманием и не пинать больно - с подобной задачей столкнулся впервые.

9
  • не думаю, что этот вопрос относится к Андроид. Вот что удалось найти мне: bannedwordlist.com/lists/swearWords.xml Думаю, можно еще поизвращаться с запросом в гугл, и найти что ни будь подобное на русском google.com.ua/… 5 мар 2015 в 19:49
  • Спасибо за корректировку. Да, список нужен именно в кириллице.
    – Chekist
    5 мар 2015 в 19:51
  • 4
    Вот мой списочек club.panasonic.ru/stopwords.txt 6 мар 2015 в 2:22
  • 2
    Вы не сможете адекватно детектировать мат без настоящего, живого модератора. Любой школьник быстро догадается заменять русскую у на английский y или переставить две буквы без особой потери смысла. Кроме того, что делать с частями слов («оскорблять»)? Разрешать их тотально или запрещать?
    – VladD
    6 мар 2015 в 7:33
  • 1
    Попробуйте распарсить список запрещенных доменов .рф там неплохой список мата составили vnovokubanske.ru/internet1/262-zapret-domen-rf.html 6 мар 2015 в 8:14

1 ответ 1

2

Тема стара как мир.

Из того, что я видел, именно php-censure - скрипт на PHP для определения нецензурных слов - оказался лучше других по отзывам. Можете взять на вооружение подход, который в нём используется: "плохие" слова определяются по частям. Отдельно приставка, отдельно корень и тд. Именно потому, что матерных слов существует не много, а много - производных от них, такой подход работает хорошо. Также используется список "хороших" слов, чтобы не зацензурировать лишнего.

Ваш ответ

By clicking “Отправить ответ”, you agree to our terms of service and acknowledge you have read our privacy policy.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками или задайте свой вопрос.