проверить, соответствует ли строка шаблону IP-адреса в python?

Каков самый быстрый способ проверить, соответствует ли строка определенному шаблону? Является ли regex лучшим способом?

Например, у меня есть ряд строк и вы хотите проверить каждый из них, чтобы узнать, являются ли они действительным IP-адресом (действительным в этом случае означает правильный формат), является ли самый быстрый способ сделать это с помощью регулярного выражения? Или есть что-то быстрее с форматированием строки или чем-то еще.

  • Печать на Python без запятых
  • Способ доступа к файлам ресурсов в python
  • Идентификация списков, содержащих 3 элемента в списках списков
  • Как распечатать элементы связанного списка?
  • Сохраняет ли функция «открыть» Python ее содержимое в памяти или в временном файле?
  • Получить список переменных и методов класса в Python
  • Что-то вроде этого – то, что я делал до сих пор:

    for st in strs: if re.match('\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}', st) != None: print 'IP!' 

  • Как оптимизировать этот код Python (от ThinkPython, Exercise 10.10)
  • Строковый модуль python vs str
  • Доступ к трассировке Python из API C
  • Метод класса вызова из другого класса
  • Python: Pass или Sleep для длительных процессов?
  • Использование и значение «in» в выражении if?
  • 12 Solutions collect form web for “проверить, соответствует ли строка шаблону IP-адреса в python?”

    Похоже, вы пытаетесь проверить IP-адреса . Регулярное выражение, вероятно, не лучший инструмент для этого.

    Если вы хотите принять все допустимые IP-адреса (включая некоторые адреса, которые вы, вероятно, даже не знали, были действительны), вы можете использовать IPy (Source) :

     from IPy import IP IP('127.0.0.1') 

    Если IP-адрес недействителен, он выдает исключение.

    Или вы можете использовать socket (Source) :

     import socket try: socket.inet_aton(addr) # legal except socket.error: # Not legal 

    Если вы действительно хотите соответствовать только IPv4 с 4 десятичными частями, тогда вы можете разделить на точку и проверить, что каждая часть представляет собой целое число от 0 до 255.

     def validate_ip(s): a = s.split('.') if len(a) != 4: return False for x in a: if not x.isdigit(): return False i = int(x) if i < 0 or i > 255: return False return True 

    Обратите внимание, что ваше регулярное выражение не выполняет эту дополнительную проверку. В качестве действительного адреса он примет 999.999.999.999 .

    Я обычно один из очень немногих экспертов Python , которые стойко отстаивает регулярные выражения (они имеют довольно плохую репутацию в сообществе Python), но это не один из тех случаев , – принятие (скажем) '333.444.555.666' как «IP-адрес» действительно плохой, и если вам нужно сделать больше проверок после согласования RE, большая часть использования RE все равно будет потеряна. Итак, я во второй раз рекомендую @ Mark: IPy для общности и элегантности (включая поддержку IPv6, если вы хотите!), Строковые операции и проверки int, если вам нужен только IPv4 (но подумайте дважды об этом ограничении, а затем подумайте еще об одном – – Время IPv6 имеет место ! -):

     def isgoodipv4(s): pieces = s.split('.') if len(pieces) != 4: return False try: return all(0<=int(p)<256 for p in pieces) except ValueError: return False 

    Я бы скорее сделал это, чем свернутое RE, чтобы соответствовать только числам от 0 до 256! -)

    Если вы используете Python3 , вы можете использовать модуль ipaddress http://docs.python.org/py3k/library/ipaddress.html . Пример:

     >>> import ipaddress >>> ipv6 = "2001:0db8:0a0b:12f0:0000:0000:0000:0001" >>> ipv4 = "192.168.2.10" >>> ipv4invalid = "266.255.9.10" >>> str = "Tay Tay" >>> ipaddress.ip_address(ipv6) IPv6Address('2001:db8:a0b:12f0::1') >>> ipaddress.ip_address(ipv4) IPv4Address('192.168.2.10') >>> ipaddress.ip_address(ipv4invalid) Traceback (most recent call last): File "<console>", line 1, in <module> File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address address) ValueError: '266.255.9.10' does not appear to be an IPv4 or IPv6 address >>> ipaddress.ip_address(str) Traceback (most recent call last): File "<console>", line 1, in <module> File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address address) ValueError: 'Tay Tay' does not appear to be an IPv4 or IPv6 address - >>> import ipaddress >>> ipv6 = "2001:0db8:0a0b:12f0:0000:0000:0000:0001" >>> ipv4 = "192.168.2.10" >>> ipv4invalid = "266.255.9.10" >>> str = "Tay Tay" >>> ipaddress.ip_address(ipv6) IPv6Address('2001:db8:a0b:12f0::1') >>> ipaddress.ip_address(ipv4) IPv4Address('192.168.2.10') >>> ipaddress.ip_address(ipv4invalid) Traceback (most recent call last): File "<console>", line 1, in <module> File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address address) ValueError: '266.255.9.10' does not appear to be an IPv4 or IPv6 address >>> ipaddress.ip_address(str) Traceback (most recent call last): File "<console>", line 1, in <module> File "/usr/lib/python3.4/ipaddress.py", line 54, in ip_address address) ValueError: 'Tay Tay' does not appear to be an IPv4 or IPv6 address 

    Еще одна проверка без повтора:

     def validip(ip): return ip.count('.') == 3 and all(0<=int(num)<256 for num in ip.rstrip().split('.')) for i in ('123.233.42.12','3234.23.453.353','-2.23.24.234','1.2.3.4'): print i,validip(i) 

    Ваше регулярное выражение не проверяет конец строки, поэтому оно будет соответствовать:

     123.45.67.89abc123boogabooga 

    Чтобы исправить это, используйте:

     '\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$' 

    (обратите внимание на $ в конце).

    Наконец, в Python обычным стилем является использование is not None вместо != None .

    вы должны предварительно скомпилировать регулярное выражение, если вы используете его повторно

     re_ip = re.compile('\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$') # note the terminating $ to really match only the IPs 

    затем используйте

     if re_ip.match(st): print '!IP' 

    но .. например, «111.222.333.444» действительно IP?

    я бы посмотрел библиотеки netaddr или ipaddr , можно ли их использовать для соответствия IP-адресам

    Если вы проверяете IP-адрес, я бы предложил следующее:

     import socket try: socket.inet_aton(addr) return True except socket.error: return False 

    Если вы просто хотите проверить, находится ли он в правильном формате, вы хотели бы сделать это для всех правовых баз (а не только для нумерации нумерации 10).

    Кроме того, только IP-адрес IPv4 (и ни один из них не является IPv6), тогда вы можете просто посмотреть, какой действительный адрес и использовать split() (для получения отдельных компонентов IP) и int() (для сравнения типов) , Здесь приведена краткая ссылка на действующие правила IPv4.

    Вы можете использовать регулярные выражения: http://www.regular-expressions.info/python.html

    Вы можете сделать это немного быстрее, скомпилировав его:

     expression = re.compile('^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$') for st in strs: if expression.match(st): print 'IP!' 

    Я обманул и использовал комбинацию нескольких ответов, представленных другими людьми. Я думаю, что это довольно ясный и прямой фрагмент кода. ip_validation должен возвращать True или False . Также этот ответ работает только для адресов IPv4

     import re ip_match = re.match('^' + '[\.]'.join(['(\d{1,3})']*4) + '$', ip_input) ip_validate = bool(ip_match) if ip_validate: ip_validate &= all(map(lambda n: 0 <= int(n) <= 255, ip_match.groups()) 

    Установить пакет netaddr

     sudo pip install netaddr 

    И тогда вы можете это сделать

     >>> from netaddr import valid_ipv4 >>> valid_ipv4('11.1.1.2') True >>> valid_ipv4('11.1.1.a') False 

    Также вы создаете объект IPAddress из этой строки и намного больше операций, связанных с ip

     >>> from netaddr import IPAddress >>> ip = IPAddress('11.1.1.1') >>> [f for f in dir(ip) if '__' not in f] ['_module', '_set_value', '_value', 'bin', 'bits', 'format', 'info', 'ipv4', 'ipv6', 'is_hostmask', 'is_ipv4_compat', 'is_ipv4_mapped', 'is_link_local', 'is_loopback', 'is_multicast', 'is_netmask', 'is_private', 'is_reserved', 'is_unicast', 'key', 'netmask_bits', 'packed', 'reverse_dns', 'sort_key', 'value', 'version', 'words'] 

    Для этого нам не нужен импорт. Это также работает намного быстрее

     def is_valid_ip(str_ip_addr): """ :return: returns true if IP is valid, else returns False """ ip_blocks = str(str_ip_addr).split(".") if len(ip_blocks) == 4: for block in ip_blocks: tmp = int(block) if 0 > tmp > 255: return False return True return False 
    Python - лучший язык программирования в мире.