출처 : http://alones.kr/blog/852?category=20
HashMap 기준에서 Hashtable과 비교하면
1. HashMap은 key와 value에 null을 허용하지만 Hashtable은 그렇지 않다.
2. HashMap은 thread safe하지 않고 (not synchronized) Hashtable은 그렇다 (synchronized). 진정한 Java인이라면 미래를 위해 Hashtable을 쓰는 게 맞을 것 같기도 하다.
HashMap 자체는 not synchronized하기 때문에 다음과 같이 Collection.synchronizedMap을 이용해서 synchronized하게 만들 수 있다.
Map m = Collections.synchronizedMap(new HashMap(...));3. HashMap은 bucket에 element들을 흩어뿌리기 때문에 get/put과 같은 기본 동작들이 동일한 시간 (constant-time performance) 에 수행된다.
HashMap과 Hashtable에서 둘 다 고려할 사항은
1. capacity와 load factor
Capacity는 bucket의 수이고 load factor는 bucket의 element가 얼만큼 찼을 경우 rehash를 발생 시킬 것인지를 정하는 것이다. rehash의 경우는 bucket의 수가 두 배로 늘어나고 각 element에 대해서 hash가 다시 일어나는 것을 의미하기 때문에 이 것은 시간-공간의 trade-off가 있다.
Load factor는 0.75를 HashMap과 Hashtable에서 둘다 ideal number로 권장하고 default value이다.
Capacity는 HashMap은 default value가 16이고 Hashtable은 11이다.
생성할 때 아주 많은 (얼만큼인지는 제시하지 않고 있다) element가 삽입될 것이라면 capacity를 초기에 높게 잡는게 좋을 것 같다.
2. ConcurrentModificationException
Iterator를 얻은 후에 Iterator를 통하지 않고 외부에서 element가 삭제되거나 추가되면 ConcurrentModificationException이 발생한다 (fail-fast라고 한다. 문제가 생기면 바로 보고하는 것으로 fail-stop이라고 한다). 당연한 말이겠지만, fail-fast로 인한 exception handling을 통해 기능을 수행하는 코드를 작성하지 말고 말 그대로 bug를 찾기 위해 이를 이용해라고 한다.
아무튼 오래 만에 JavaDoc을 자세히 읽어 본거 같다. 프로그램에서 많은 것들이 중요할 것이고 그 중 자료 구조 (특히 자바와 같은 언어에서)도 많은 것을 고려해야 하기에 포스트를 지루하게 써보았다.
"별 생각 없이 쓴다" 라는 말 자체를 이미 거론해 버렸지만 그리고 그 목적으로 HashMap을 거론했지만, "별 생각 없이 쓴다" 라는 말 자체는 (그리고 그 "별 생각 없이 쓴 것"들이 많아 질 수록) 미래의 재앙을 키워가는 것이기 때문에 지양 해야 할 것이다.
[Ref]
HashMap Java Doc SE6: http://java.sun.com/javase/6/docs/api/java/util/HashMap.html
Hashtable Java Doc SE6: http://java.sun.com/javase/6/docs/api/java/util/Hashtable.html
Fail-fast (Fail-stop): http://en.wikipedia.org/wiki/Fail-fast
alones
댓글 없음:
댓글 쓰기