Как определить оператора по номеру телефона: основные правила и способы определения

Для этого, я в библиотеке сделал систему фильтровкоторые по регулярным выражениям из конфигов преобразуют названия операторов и регионов. На данный момент, я навел порядок с названиями крупных операторов. Особо сильное разнообразие операторов у того же Tele2. С регионами тоже надо будет как-нибудь разобраться и заполнить их конфигурацию.

Совместимость

Действительно, у Россвязи очень много таких диапазонов особенно почему-то у Tele2. В таких случаях диапазон будет записан в виде нескольких масок. Например, диапазон из номеров моя библиотека пребразует к маскам которые в точности будут повторять эти номера. А, скажем, диапазон будет записан как набор масок [,89? Код который это делает можно посмотреть. Ранее оператор и регион определялись по первым 5 цифрам федерального номера. В связи с возможностью сменить оператора теперь так можно достоверно определить только регион Остальные 5 цифрам в данном контексте нужны только, чтобы точно определить оператора.

Не вижу противоречия Берём первые 5 цифр из вашего примера и получаем регион PS под регионом я подразумеваю то, что мобильные по номера телефона определить страну или оператора называют домашней сетью — по сути область, в которой зарегистрирован абонент, она же является отчётной точкой для тарификации. Хабр Geektimes Тостер Мой круг Фрилансим. Публикации Пользователи Хабы Компании Песочница. Как определить мобильного оператора и домашний регион по номеру телефона Открытые данныеАлгоритмыOpen source Из песочницы Когда мы пытаемся определить какому оператору принадлежит номер телефона, то обычно смотрим на его DEF код.

Например, если номер начинается нато это МТС, на — Билайн, — Мегафон все зависит от вашего по номера телефона определить страну или оператора.

Определение оператора по номеру телефона

Но этот метод очень условный и совершенно не подходит когда нужны точные данные. В реальности все сложнее: DEF коды часто делят между собой несколько операторов, и совсем необязательно, что искомый номер относится к операторам большой четверки. Ну и наконец, номер можно просто портировать. Использовать эти данные можно как угодно, начиная от предзаполнения адреса в анкете пользователя и перенаправления на региональную версию вашего сервиса, до использования этих данных в процессинге и статистике.

В конце статьи будет ссылка на github с исходниками. Источники данных Россвязь Свой номер телефона мы получаем когда заключаем договор на обслуживание с оператором связи. В свою очередь, распределением диапазонов номеров между операторами связи, а также стандартизацией и общим контролем за услугами связи занимаются соответствующие государственные и международные организации.

В России такой организацией является Федеральное агентство связи Россвязь. Таким образом, самым надежным источником информации кто обслуживает российский номер телефона является Россвязь, причем это открытые данные, которые агентство публикует у себя на сайте: Свежий список диапазонов мобильных номеров находится в CSV по ссылке. Каждая строка в файле выглядит как: DEF-код, начало диапазона, конец диапазона, название оператора, название региона Однако, с года появилась возможность переносить номер от оператора к оператору.

Значит, руководствуясь только реестрами Россвязи, нельзя однозначно сказать, что номер обслуживается определенным по номером телефона определить страну или оператора. Зато это вполне можно сказать про регион, ведь переносимость номера работает только в рамках домашнего региона и перенести номер из МТС Новосибирск в Tele2 Санкт-Петербург не получится в принципе. Таким образом, если по задаче нужно определить только по номер телефона определить страну или оператора пользователя, то реестров Россвязи будет достаточно.

Процедуру подключения к базе можно найти у них на сайте: Но, к сожалению, насколько я знаю, напрямую подключиться к ним не просто, а получив подключение, делиться базой ни с кем. Структура этой по номера телефона определить страну или оператора крайне проста: На момент написания статьи, в БДПН находится около 6 миллионов записей. Как определять абонентов Самое очевидное решение этой задачи: Сложность этого алгоритма будет как у бинарного поиска, что довольно неплохо.

Но есть более оригинальный и универсальный способ реализации, сложность которого — константа, независимо от размера данных. Этот метод предполагает использование масок номеров. Причем после знака вопроса может стоять только знак вопроса. С такими масками очень удобно работать, например, задавать их вручную в конфигурации. Кроме того, представление диапазонов в виде масок дает возможность использовать более эффективные по номера телефона определить страну или оператора хранения и простые алгоритмы поиска.

Суть алгоритма в следующем: Значениями в таблице являются объекты-операторы с регионами. Работу поиска нагляднее всего объяснить на примере. Скажем, мы ищем информацию по номеру: Сперва ищем в таблице запись по ключу в точности как исходный номер: Если не найдено, то меняем последнюю цифру номера на "? Если опять ничего не нашли, то снова меняем последнюю цифру на "?

В конце концов мы сделаем поиск по ключу ?????? Видно, что в данном случае сложность алгоритма равна сложности нескольких взятий из хеш-таблицы, что при правильной реализации обычно равно константе. Сложность по номера телефона определить страну или оператора в таком дереве зависит от длины телефонных номеров, которая по рекомендации ITU-T E. Этот же алгоритм можно применить и к портированным по по номерам телефона определить страну или оператора телефона определить страну или оператора — их можно просто добавить в ту же самую хеш-таблицу.

Префиксное дерево Гораздо более эффективный по производительности метод — построение префиксного дерева из масок, который будет опираться на то, что номера состоят из цифр. Каждая нода этого дерева сможет иметь до 10 цифровых нод-потомков и одной wildcard-ноды. Wildcard-нода может иметь только wildcard-потомков. При добавлении очередной маски в дерево, каждый символ маски последовательно превратится в ноду.

Таким образом, фактически мы представляем все имеющиеся у нас маски в виде одного дерева. Например, дерево состоящее из масок: Алгоритм поиска в дереве, думаю, уже понятен: В первую очередь спускаемся по цифровым нодам, если цифровых нод нет, то смотрим есть ли "? Если есть, то в конечном итоге проверяем длину маски, и если она соответствует номеру, то оператор найден. Заключение В зависимости от ограничений, можно комбинировать эти подходы и разделять хранилища перенесенных номеров и масок Россвязи.

Например, по памяти выгоднее для портированных номеров использовать подход с хеш-таблицей, а для реестров Россвязи всегда выгоднее использовать дерево масок. При поиске сначала смотреть в таблице, а если в ней ничего не найдено, то искать в дереве. Разделение хранилищ в первую очередь удобно для их автообновления, то есть если изменилась БДПН а она меняется постоянното совсем необязательно перечитывать диапазоны Россвязи. Для максимальной производительности можно хранить всю информацию прямо в оперативной памяти.

В моей реализации на Java, дерево масок Россвязи занимает не более Мб, хеш-таблица с масками портированных номеров: Если же портированные номера хранить в префиксном дереве, то из-за того, что ноды дерева получаются очень разреженные, памяти потребуется примерно в 1. Но зато, это дает достаточно весомый прирост производительности. Новые техпроцессы для производства микросхем все чаще откладывают — почему?

Junior Data Developer Python. Да, API Мегафон тоже отличное и легкое решение задачи. Но моя статья о том, как делать определение очень быстро, локально у себя, без лишних зависимостей. А также, на какие данные и алгоритмы это определение опирается. При необходимости, кстати, можно самому поднять у себя подобный API готовая реализация есть репозитории. Знание домашнего региона — это хорошо, но в чём практическая польза от знания оператора?

Популярное

НЛО прилетело и опубликовало эту надпись. С кодом была история ; а сколько ещё. Из тех, что сейчас приходят в голову: Если применить нехитрое наблюдение, что все номера представляют собой вид 79xxx-??? Содержать эта таблица будет указатели на таблицы вторичного поиска, в которых содержится??? Добавка 8кбайт таблицы первичного поиска на результат почти не влияет и получаем 4, чуть больше 4 байт на запись.

Новые способы узнать, какой оператор на номере.

Поиск будет двоичным по вторичным таблицам, но за счет заметно меньшего объема памяти будет заметно быстрее, имхо. Можно разбить как 79xxx-xx? Это может негативно сказаться на производительности. Или обнаружим несколько записей, п. Там есть по номера телефона определить страну или оператора и по 2, и по 5, и по номера, к сожалению. И, кстати, регионы диапазонов заданы у Россвязи не кодами, а наименованиями, которые могут обозначать один регион разными способами.

Какие-то работы по приведению названий в порядок явно ведутся, судя по обновлениям, но пока не закончены. Также, названия некоторых регионов навскидку, к сожалению, не вспомню и операторов не бьются с БДПН. Уверяю вас, тут будет все будет хорошо. Сейчас, к сожалению, этот метод уже не сработает. Например, самые первые в списке маски Россвязи: Это совершенно разные области.

И эти первые цифры больше нигде больше не могут повториться у других операторов в реестре Россвязи. И если бы ваше правило работало, то у операторов в конкретных областях не было бы емкостей больше А это не так, так как есть емкости, например, по 1.