Post

IP parsing(+C), URL parsing 정규식 pattern

직접 짜기 전에 org.springframework.web.util.UriComponentsBuilder 참조. IP, HOST, HTTP 등 패턴이 static 변수로 선언되어 있음. 또는InetAddressValidator 같이 아예 유틸리티 클래스로 제공되고 있을 수 있다. 비슷한 계열이 몇 개씩 된다.

1
2
3
4
5
6
7
8
9
10
11
InetAddresses.isInetAddress()  -- guava 530ms
   InetAddressUtils.isIPv4Address()  -- httpclient 1146ms
   InetAddressValidator.getInstance().isValid()  -- apache.commons 1573ms
InetAddress.getByName() -- java.net 인데...
 domain name을 넣으면 DNS 호출하도록 동작하게 되어 있음.
 IP string을 넣으면 DNS 호출 까지는 안하고 패턴 체크만 한다.
 malformed string이 들어오면 DNS까지 다녀오므로 비추.


\* 시간은 1000만번 반복 기준

Regex는 느리다? 그렇지 않다.

compile은 오래걸리지만, evaluation할 때는 그냥 문자열 찾는 것 만큼 빠르게 잘 동작함. 그래서 굳이 regex를 피할 필요는 없다. 그냥 적재 적소에 사용하면 된다.

URL parsing

1
2
3
regexp [url, scheme, slash, host, port, path, query, hash]
var parse\_url = /^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]\*))?(?:\?([^#]\*))?(?:#(.\*))?$/;

IP parsing

1
2
^(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$

C에서 IP valid check

1
2
3
4
5
6
7
bool isValidIpAddress(char \*ipAddress)
{
struct sockaddr\_in sa;
int result = inet\_pton(AF\_INET, ipAddress, &(sa.sin\_addr));
return result != 0;
}

근데 보통은 검사 안해줘도 connect에서 perror로 오류내용 출력할 수 있다.

1
2
3
4
5
if (connect(sock, (struct sockaddr \*)&sin, sizeof(sin))) {
perror("connect");
exit(1);
}

This post is licensed under CC BY 4.0 by the author.