2. 인터페이스의 변화 와 Stream
Java8에 변화된 인터페이스와 새롭게 추가된 Stream에 대해 정리한 글
Last updated
Java8에 변화된 인터페이스와 새롭게 추가된 Stream에 대해 정리한 글
Last updated
자바의 다형성
을 극대화하여 개발코드 수정을 줄이고 유지보수
를 용이하게 하기 위함
다형성? 동일한 메시지를 수신했을 때 객체의 타입에 따라 다르게 응답할 수 있는 능력
추상메서드를 가짐으로써 다형성을 극대화하면서 어떤 역할
을 구현하는 방법(객체들이 따라야 하는 책임의 집합을 서술한 것)이라는 공통점이 있다.
하지만 추상 클래스는 is-a
관계로 -는 -이다.
의 개념이며 책임의 일부를 구현해놓은 것이고 인터페이스는 has-a
의 관계로 -는 -를 할 수 있다
의 개념으로 책임의 집합들을 나열해 놓은 것.
이때 이러한 관계가 객체지향에 있어 중요한 것은 객체의 속성이 아니라 객체의 행동간의 관계라는 것.
한마디로 닭은 새다
, 맥은 os이다
와 같은 문장이 있을때 이 문장들 앞에 클라이언트 입장에서
라는 말이 빠져있는 것이다. 실제 세계의 관점으로 바라보며 객체간의 관계를 정의하는 것이 아닌 이 객체들을 사용하는 클라이언트 입장에서 바라보며 특정 객체의 행동을 통해 관계를 맺어야 한다.
서브 클래싱과 서브 타이핑
서브 클래싱 : 다른 클래스의 코드를 재사용할 목적으로 상속을 사용하는 경우. 자식과 부모클래스간의 행동이 호환되지 않아 자식인스턴스가 부모인스턴스를 대체할 수없고 이를 구현 상속
/ 클래스 상속
이라고 부른다.
서브 타이핑 : 타입 계층을 구성하기 위해 상속을 사용하는 경우. 자식과 부모클래스간의 행동이 호환되어 인스턴스를 대체할 수 있다.
🔼 조영호님의 오브젝트 서적 이미지
💡 다음 스터디에서 오브젝트 서적으로 공부해보면 좋은 내용 같아요.
개발 기간 단축
팀내에서 서로 다른 부분을 개발할 때 인터페이스만 잘 정의해두어도 서로의 개발이 끝나지 않아도 따로 코드를 작성할 수 있다.
클래스간의 낮은 결합도
코드의 종속을 줄이고 유지보수성을 높일 수 있다.
표준화 가능
협업 시에도 일정한 틀의 형태로 개발을 할 수 있게 한다.
필드로는 상수만 가능 (변수는 불가능 하다.) : 무조건 public static final
로 선언 되며 생략 가능
추상 메서드 존재 : 무조건 public abstract으로 선언되며 생략 가능
추상클래스는 단일 상속을 원칙으로 한다.
상속의 가장 큰 문제점은 캡슐화를 위반한다는 것과 설계가 유연하지 않다는 것.
코드의 재사용을 위해서는 상속이 아니라 합성
을 사용하는 것이 바람직하고상속은 타입계층을 구조화하기 위해 사용
해야 한다. 의존성에 의한 영향이 적은 경우에도 추상화에 의존하고 의존성을 명시적으로 드러내는 것이 좋은 설계 습관이다.
1-4-1. 메소드 오버라이딩 문제 해결했지만..
예를 들어, Person 인터페이스에서 메서드 a(), b(), c(), d()
를 제공한다고 하자.
이를 구현하는 Jun, Hong, Chang 클래스가 존재하고 각각 필요한 메서드는 하나씩 밖에 없는 상황이다.
필요한 메서드가 아니라도 인터페이스 특성상, 모든 메서드를 오버라이딩 해야만 하는 이슈가 있다.
Java8 이전에는 추상클래스를 활용하여 이 문제를 해결하였다.
1-4-2. 해결하지 못한 문제
매번 Adapter 추상클래스를 만들어야한다.
다중 상속이 불가능하다.
이러한 문제를 해결하기 위해 Java8 인터페이스에는 어떤 변화가 있었는지 알아보자.
Java 8 부터는 인터페이스에도 메소드 선언뿐만 아니라
default method
와static method
를 통해 구현이 가능해졌다.
추상 메서드가 아니라 구현이 된 메서드를 제공하는 방법으로 코드의 중복을 피하고 기능을 추가할 때 사용
하위 호환성
이 가장 큰 목적으로 어떤 인터페이스에 기능을 추가했을때 이를 상속, 구현한 클래스들이 깨지지 않게 하기위한 목적으로 default 메서드를 사용할 수 있다. 대표적으로 Collection의 of나 forEach 등이 있다.
람다
를 활용할 수 있는 기술 중 하나로 일종의 무한한 데이터의 흐름
. 배열 또는 컬렉션, Map과 같은 자료구조들을 하나의 데이터 흐름으로 만듦으로서 함수 여러개를 chaning하여 코드의 양을 줄이고 간결하게 표현할 수 있게 해준다.
Foo 인터페이스를 구현하는 클래스가 많아지면, 새로운 기능의 메소드를 선언했이 추가됐을 때 구현체 모두 컴파일 에러가 발생.
이를 해결하기 위해, Default Method
등장!
장점
해당 인터페이스를 구현한 클래스를 깨트리지 않고 새 기능을 추가할 수 있음.
주의할 점
기본 메소드는 구현체가 모르게 추가된 기능이기 때문에, 문제가 생길 수 있음.
컴파일 에러는 아니지만 구현체에 따라 런타임 에러 발생 가능
반드시 문서화 (@ImplSpec
자바독 태그 사용)
이래도 문제가 발생하는 경우는 구현 클래스에서 Overriding
을 이용해 재정의 할 수 있다.
주의할 점
Object가 제공하는 기능은 default 메소드로 제공할 수 없다.
equals
, hashCode
, toString
등
구현체가 재정의 해야한다!
인터페이스에서 추상 메서드로 선언하는 것은 괜찮다.
모두 공통으로 제공하기 때문에 추상 메서드로 분류하지 않는다.
본인이 수정할 수 있는 인터페이스만 수정 가능하다.
인터페이스를 상속받는 인터페이스에서 다시 추상 메소드로 변경할 수 있다.
Diamond Problem
구현체가 상속받는 두 인터페이스 모두 동일한 기본 메소드가 있는 경우?
Error
: DefaultFoo inherits unrelated defaults for printNameUpperCase() from types Foo and Bar
Bar, Foo 중 무엇을 사용할지 모르기 때문에 컴파일 에러 발생
충돌하는 default method 직접 override 해야한다.
인스턴스 없이 수행할 수 있는 행동을 정의 한 것
해당 인터페이스를 구현한 모든 인스턴스나 해당 타입에 관련된 헬퍼 또는 유틸리티 메소드를 제공할 때 인터페이스에 static method 제공 가능
✅ 바이트 코드
접근지정자를 생략하면 기본적으로 public이 붙게되고 java8에서는 static method가 public만 가능하지만 java9 이상부터는 private도 가능하다. 당연히 private이기 때문에 외부에서는 접근이 불가능하다.
private 메서드의 조건
구현부가 존재해야 한다.
해당 인터페이스 내부에서만 사용이 가능하다.
JAVA8 에서 추가된 기본 메소드로 인해 API 에 변화에 대해 알아보자
순회를 편하게 할 수 있다! 대부분 혼자서 사용하는 경우는 거의 없고 Collection에 포함되어서 사용한다.
3-1-1. forEach()
names.forEach(System.out::println)
forEach 는 내부 엘리먼트를 순회하며 각각의 요소들을 파라미터로 전달된 일급함수에 Functional Interface인 Consumer가 들어오고 처리.
단순 출력만 하기 때문에 메소드 레퍼런스 기능을 이용해 간결하게 작성!
for-of{...}
기존에는 for-of 문을 사용해 출력이 가능하다고 함.
하지만 조금이나마 더 간결한 forEach를 사용하는 것이 좋아 보임.
Iterable
을 상속받는 인터페이스다!
3-2-1. Spliterator
iterator 와 비슷한 개념이지만 Collection 을 분할한다는 점에서 차이가 있음.
Spliterator spliterator = names.spliterator();
iterator와 비슷하지만 분할할 수 있는 기능을 가진 Iterator 를 만들어 반환
spliterator.tryAdvance(System.out::println)
iterator의 hasNext()메소드와 유사
다만 내부 메소드에 파라미터로 forEach()와 동일하게 Functional Interface인 Consumer가 들어오고 더 이상 들어올게 없을 경우 false를 반환
이 예제에서는 들어온 값을 단순 출력하는 메소드 레퍼런스를 사용
여기까지는 iterator와 차이가 없다. trySplit을 사용해보자.
Spliterator<String> trySplit = spliterator.trySplit();
spliterator에서 trySplit()메소드를 호출하게되면 해당 spliterator에서 앞에서부터 절반의 요소를 꺼내 새로운 spliterator를 만들어 반환
🔼 trySplit() 실행 결과
while(spliterator.tryAdvance(System.out::println));
trySplit()을 통해 앞의 두 String(yj, youngjun)이 분할되어 빠져나갔기 때문에 뒤의 두 값만 출력
while(trySplit.tryAdvance(System.out::println));
spliterator 에서 가져온 앞 두 값(yj, youngjun)을 출력
3-2-2. removeIf
Collection 요소를 순회하며 인자로 넘겨주는 함수를 Functional Interface인 Predicate에 넘겨줘서 true 이면 삭제
names.removeIf(s -> s.startsWith("y"));
names를 순회하며 각 요소들 중 단어가 'y'로 시작하는 단어를 찾아 삭제
3-2-3. etc
이후에 자세히 다룰 예정이다.
Stream()
parallelStream()
정렬에 사용되는 인터페이스
3-3-1. reversed
정렬을 역순으로!
Comparator<String> compareToIgnoreCase = String::compareToIgnoreCase
메소드 레퍼런스를 메소드 체이닝 방식으로 사용할수는 없기에 분리하여 Comparator 타입의 Functional Interface인 compareToIgnoreCase 를 만들어준다.
names.sort(compareToIgnoreCase.reversed());
미리 선언해놓은 String 의 정렬 기준 메소드 레퍼런스에 reversed()
메소드를 호출해 역순으로 정렬
❓ 만약, 여기서 다음 정렬조건을 사용하여 정렬을 이어가고싶다면 thenComparing() 메소드를 이용하여 추가적인 정렬을 할 수 있다.
3-3-2. static reverseOrder() / naturalOrder()
특정 타입의 Comparable이 지정되어있으면 일단 그 기준으로 역순이든 자연순이든 세팅해서 정렬함.
3-3-3. etc
static nullIsFirst() / nullIsLast()
static comparing()
연속된 데이터를 처리하는 오퍼레이션들의 모음
🔼 이미지 출처
stream
은 컨베이어 벨트
와 비슷하다.
컨베이어 벨트에 떡조각(데이터)들을 흘려보내면서 반죽을 하고, 앙금을 쌓고(map), 불량품은 빼고(filter) 포장을 해서(collect) 내보낸다.
데이터를 담고 있는 저장소가 아니다.(컬렉션이 아니라는 의미)
확장해서 재사용이 불가능한데, 아래에서 자세히 살펴보자.
stream은 처리하는 데이터 소스를 변경하지 않는다.
즉 내가 A
라는 데이터를 수정한다고 해서 원본데이터가 수정되는 것은 아니라는 의미.
스트림으로 처리하는 데이터는 오직 한 번만 처리한다. - 컨베이어 벨트에서 데이터들이 한 번 지나간뒤 다시 돌아오지 않음.
스트림은 종료연산을 하지 않는 이상 그전까지가 하나의 인스턴스로써 계속 사용이 가능하지만 종료연산을 수행하면 재사용이 불가하게 되는데 이는 스트림
은 저장된 데이터를 꺼내서 처리하는 용도이지 데이터를 저장하는 목적이 아니기 때문이다.
Stream은 AutoCloseable을 상속받은 BaseStream을 상속받아 close()메서드를 가지고 있어 종료연산을 사용하게 되면 우리가 명시하지 않아도 내부적으로 close()를 시켜주기 때문에 재사용이 불가능하다.
앞서 작성한 코드의 바이트코드 일부분인데, 앞서 작성한 Stream을 참조영역 2에 저장하고, count()메서드에서 이를 load하고 pop하는 것을 볼수 있다. 그런데 max()메서드에서 이 pop한 참조영역 2를 다시 load하려고 하니 런타임에 에러가 발생하는 것이다.
무제한의 데이터일 수 있다.
이 경우 Short Circuit(limit, skip) 메소드를 사용해서 제한 가능
중개 오퍼레이션은 근본적으로
lazy
하다.
names.stream().map(s->{ ... });
stream의 중개오퍼레이터를 사용하는 순간에는 코드가 수행되지 않는다.
그렇기 때문에 중개오퍼레이션 map 안에 있는 출력문이 수행되지 않는다.
수행시키기 위해서는 스트림 파이프라인을 정의해야 한다.
1-5-1. 지연연산을 통한 성능 향상
내용은 지난주 정리했던 내용중 람다의 지연연산과 동일한 내용이다.
추가적으로 중간연산의 순서에 따라 위처럼 불필요한 연산을 막아 성능향상을 꾀할 수 있기때문에 중간연산의 순서도 신경을 써주면 좋다.
1-5-2. 지연처리 가능
위를 돌려보면 print가 되지 않은 것을 볼 수 있는데 Stream은 종료연산이 수행될때까지 중간연산은 시작하지 않고 하나의 Stream형태로 저장이 되어 미리 Stream을 선언해두고 나중에 결과를 확인할 수 있다.
byte코드를 보면 Strema형태를 참조타입으로 저장하는 것을 볼 수 있다 .(ASTORE)
손쉽게 병렬 처리를 할 수 있도록 parallelStream() 제공
forEach를 통해 단순한 반복 출력이 아닌 로직(조건문)이 추가될수록 stream을 통해 구현할수록 간결해지기 때문에 stream을 쓰는 것 외에도 기본적인 for문이나 for-of문으로는 로직들을 병렬적으로 처리하는게 쉽지 않다.
하지만, parallelStream()을 이용하면 손쉽게 병렬처리를 할 수 있다.
자바는 ForkJoinPool 라이브러리를 이용해서 병렬처리를 한다.
ForkJoinPool?
Fork(Task를 잘게 쪼개는 것)를 수행하고 해당 Pool에 있는 스레드들이 task를 처리하고 join을 통해 합친다.
이때 ForkJoinPool에는 task가 존재하는 queue가 있고, 스레드들이 이 queue에서 task를 할당받아 자신의 queue에 적재해가며 처리하는데 놀고있는 스레드가 존재한다면 다른 스레드의 queue에서 task를 steal하는 방법으로 동작하는 Work-Stealing메커니즘을 이용하기 때문에 task가 하위 task를 생성하거나 small task가 많을 경우 효과적이다.
sequential() 을 이용하면 다시 시퀀셜 스트림으로 변경도 가능하다.
1-6-1. Pool Size 조절방법
property
ForkJoinPool 객체 이용
ForkJoinPool생성자 매개변수로 size를 전달하고 submit()메서드에 람다로 작업할 내용을 정의해주고 get()을 통해 terminate()해주어야 실행이 된다.
default Pool size 변경
build시에 위 옵션으로 기본 풀 사이즈를 변경이 가능하다.
1-6-2. 단점
위에서 설명한것과 같이 ForkJoinPool 특성상 task를 분할할때(fork) 균등하게 분배를하게 되는데 이때 이 분할하는 작업의 비용이 높게 되면 오히려 성능이 안좋을 수 있다. 예를 들어, 이미 사이즈를 알고 있는 ArrayList같은 경우는 분할하는 작업이 빠를 수 있지만 사이즈를 모르는 LinkedList같은 경우에는 순차작업과 같거나 더 느릴 수가 있다.
병렬로 처리되는 작업이 독립적
이지 않다면 이도 오히려 성능에 안좋을 수 있다. 예를 들어 sorted()/distinct()와 같은 작업을 수행할때는 내부의 상태에 대한 변수를 작업이 공유
해야지만 가능한 작업이므로 lock
의 작업이 추가로 발생하고 스레드가 대기하는 상황이 생기기 때문에 순차적으로 실행하는 경우가 더 효과적일 수 있다.
정리하자면, 사실상 멀티 스레드를 이용한다고 성능이 무조건 좋은 것은 아니며 오히려 느려질 가능성이 더 높다. 대부분의 경우 그냥
stream
을 쓰는게 나으며 정말 큰데이터를 다룰 때 성능 테스트 후parallelStream()
을 사용하면 된다.
스트림이라는 컨베이어 벨트에 0개 혹은 다수의 중개 오퍼레이터(intermediate operation)과 한개의 종료 오퍼레이션(terminal operation)으로 구성. 이 스트림은 반드시 하나의 종료 오퍼레이션이 있어야 하며, 만약 종료 오퍼레이션이 없다면, 스트림은 존재하지만 코드 수행은 되지 않는다.
스트림의 데이터 소스는 오직 터미널 오퍼레이션을 실행할 때에만 처리한다!
스트림 인스턴스 생성하는 메서드
Arrays.stream(배열타입 변수)
: 배열을 Stream 타입 객체로 생성
collection.stream()
: Collection타입의 객체(Collection, List, Set)를 Stream 타입 객체로 생성
Stream.empty()
: 비어있는 Stream() 객체
Stream.builder().add()...build()
: 빌더를 이용한 Stream 생성
Stream.generate(() -> {}).limit()
: 람다를 이용하여 생성하는 방식으로 람다의 return값이 들어있는 Stream을 생성한다. 이때 무한히 생성하기 때문에 limit메서드로 제한을 주어야 한다.
Stream.iterate(startValue, () -> {}).limit()
: 초기값부터 해당 값을 input으로 하는 람다를 반복하여 나온 값으로 Stream을 생성
IntStream.reange(1,5).boxed()
: IntStream을 생성후 boxed()메서드를 통해 Stream 인스턴스로 반환
Random().ints().boxed()
: 랜덤한 int값을 이용해 Stream 생성
"String".chars()
: IntStream을 반환
char들은 ascii 값으로 하나의 숫자로 표현할 수 있기 때문에 IntStream을 반환한다.
list.parallelStream()
: 병렬 스트림
Stream을 리턴한다. 필터링, 맵핑과 같이 어떠한 결과를 만들어가는 중간 작업들의 메서드 ( Intermediate operations )
Stateless/Stateful 오퍼레이션으로 더 상세하게 구분할 수도 있다.
대부분 Stateless지만 distinct나 sorted처럼 이전 소스 데이터를 참조해야 하는 오퍼레이션은 Stateful 오퍼레이션.
filter, map, limit, skip, sorted, ...
2-2-1. 메서드
filter(Predicate)
: Predicate의 반환값이 true인 데이터만 선택
distinct()
: 중복된 데이터 제거
map(Function<T,R>)
: 데이터들을 가공하여 다른 값으로 변경하고자 할때 사용
flatMap(Function<T, Stream>)
: 중첩구조를 제거하고 단일 컬렉션으로 만들어 map연산을 수행(flattening)
sorted(Comparator)
: Comparator을 이용해 데이터 정렬
peek(Consumer)
: 데이터를 변경하지 않고 그저 순환하는 메서드로 중간에 결과 확인할
2-2-2. flatMap 활용 예시
만일 문자열이 들어있는 배열에서 모든 문자열에 대해 사용된 알파벳들만 찾아내는 함수를 구성한다고 할때 map()을 이용하면 위와 같이 결과가 나오게 된다.
이는 알파벳을 하나하나 조회하기 위해 String을 split()을 이용하여 String배열로 한번더 나누는 과정에서 자료구조의 depth가 한단계 증가하여 Hello World
라는 단어에서 distinct가 수행된게 아니라 Hello
, World
따로 수행되었기 때문이다. 바로 이럴때 flatMap을 이용하면 한단계 중첩구조를 벗겨낼 수 있다.
Stream을 리턴하지 않는다! 최종적으로 결과를 만들고 반환함으로써 chaining을 끝내는 메서드 ( terminal operations )
collect, allmatch, count, forEach, min, max...
Stream은 AutoCloseable을 상속받은 BaseStream을 상속받아 close()메서드를 가지고 있어 종료연산을 사용하게 되면 우리가 명시하지 않아도 내부적으로 close()를 시켜주기 때문에 재사용이 불가능하다.
단순 계산
count() : 총 갯수
sum() : 합
min() : 최소값
max() : 최대값
average() : 평균값
reduce() : 정의한 로직을 계산 후 결과 반환
reduce(BinaryOperator) : 각 요소를 처리하는 로직
reduce(T,BinaryOperator) : 계산을 위한 초기값 T를 가지고 각 요소를 처리
collect : 특정 데이터형태, 자료구조로 바꾸어주는 함수
matching
anyMatch(Predicate) : 하나라도 조건을 만족하는 요소가 있으면 true
allMatch(Predicate) : 모든 요소가 조건을 만족하면 true
noneMatch(Predicate) : 모두 조건을 만족하지 않으면 ture
forEach() : 요소를 돌면서 실행하는 메서드
파이프라인을 어떻게 생성하느냐에 따라 실행 순서와 성능이 차이나기도 한다.
Stream.of()
로 Stream 생성
map
으로 데이터 가공 (UpperCase로 변환)
filter
로 필터링 (A로 시작하는 String만 추출)
종료 오퍼레이션 : forEach
로 필터링된 끝난 결과로 함수 실행
실행 결과
filter를 먼저 실행하도록 변경해보자.
Stream.of()
로 Stream 생성
filter
로 필터링 (a로 시작하는 String만 추출)
map
으로 데이터 가공 (UpperCase로 변환)
종료 오퍼레이션 : forEach
로 필터링된 끝난 결과로 함수 실행
실행 결과
두 예시 모두 동일하게 forEach 는 필터링된 String A 만 출력한 것을 확인할 수 있음.
최종적으로 종료 오퍼레이션은 한번만 실행되지만, 중간에 map 실행 횟수가 차이나게 된다.
stream api를 정리하고 예제를 통해 알아보자.
걸러내기
Filter(Predicate)
stream에서 특정 조건(Predicate)을 만족하는 엘리먼트만 새로운 스트림으로 반환
변경하기
Map(Function) 또는 FlatMap(Function)
각각의 요소에서 특정요소만 꺼내거나 혹은 변경하여 새로운 스트림으로 반환
flatMap의 경우 Array나 Object로 래핑되어있는 내용물을 꺼내어 하나로 합친 스트림으로 생성 후 반환
생성하기
generate(Supplier) 또는 Iterator(T seed, UnaryOperator)
seed 로부터 UnaryOperator 을 무제한으로 반복하는 스트림 반환
ex: 랜덤 무제한 스트림
스트림에 있는 데이터가 특정 조건을 만족하는지 확인
anyMatch(), allMatch(), nonMatch()
스트림의 엘리먼트를 돌며 특정 조건을 만족하는지 확인
ex1: 스트림의 있는 모든 값이 10보다 작은지 확인(allMatch)
ex2: 스트림의 제목 중 "Test"가 들어가는 제목이 있는지 확인(anyMatch)
개수 세기
count()
ex1: 10보다 작은 수의 갯수를 센다.
스트림을 데이터 하나로 뭉치기
reduce(identity, ByFunction), collect(), sum(), max()
ex1: 모든 숫자 합 구하기
ex2: 모든 데이터를 하나의 리스트 혹은 Set에 옮겨 담기
Reference
https://github.com/gowoonsori/my-tech/blob/master/java/java8/interface.md
https://github.com/gowoonsori/my-tech/blob/master/java/java8/stream.md
https://dev-milk.tistory.com/5
https://futurecreator.github.io/2018/08/26/java-8-streams-advanced/
https://mangkyu.tistory.com/11a
https://github.com/gowoonsori/my-tech/blob/master/java/java8/interface.md
https://github.com/gowoonsori/my-tech/blob/master/java/java8/stream.md
https://dev-milk.tistory.com/5
https://futurecreator.github.io/2018/08/26/java-8-streams-advanced/
https://mangkyu.tistory.com/115