이클립스에서 *.java를 단축키 눌러서 실행시킬 줄만 알았지 *.java 파일이 어떠한 과정을 거쳐 실행이 되는지는 알지 못했습니다. 따라서 자바 컴파일러는 어떤 역할을 수행하며, 어디서 많이 들어본 JVM은 무엇인지 그리고 자바에서 *.java를 어떻게 컴퓨터가 실행시키는 지에 대한 과정을 알아보려고 합니다.
틀린 부분이나 질문 사항이 있으시면 언제든지 말씀해주세요 :)
전체적인 자바의 실행과정
위 그림은 전체적인 자바의 실행과정을 보여주고 있습니다. 사실 더 깊숙이 파고들면 이것보다 훨씬 많은 것들이 존재하지만, 이번 글에서는 이정도만 알아보겠습니다.
핵심키워드
*Java Compiler , *JVM , *Interpreter , *JIT compiler
Java Compiler with binary code, byte code
Compiler(이하 컴파일러) 는 번역하면 '해석기'라는 의미로 인간이 사용하는 고레벨언어를 기계가 이해할 수 있는 기계어(저레벨언어)로 해석해주는 번역 프로그램입니다.
일반적으로 소스파일 을 컴파일한 파일을 목적파일 이라고 하는데 C, C++ 같은 언어는 목적파일이 바이너리 코드의 형태를 갖습니다. 하지만 자바에서는 바이너리 코드가 아닌 바이트 코드를 가진 바이트 파일로 변환이 됩니다. 그리고 바이트 파일이 그림(1) 에 나오는 .class 파일 입니다.
*소스파일 : 개발자가 작성하는 고레벨언어인 소스코드로 구성된 파일 ex. *.java, *.c
*목적파일 : 소스파일을 컴파일해서 생긴 파일 ex. 바이트코드, 바이너리 코드
바이트 코드로 작성된 .class 파일은 기계(ex. JVM)가 읽기 편하도록 만들어 놓은 파일입니다. 이 파일을 JVM이 읽어들여 실행합니다. 이 때, 클래스 파일을 실행하기 위해 필요한 모든 .class 파일을 불러들이고 코드를 검증한 뒤 메모리로 올리는 작업을 수행합니다. 만약 클래스가 없거나 오류가 있다면 오류가 발생하고 그렇지 않다면 정상적으로 실행됩니다.
이클립스를 이용하여 mainClass를 만들었습니다.
그리고 bin 폴더로 이동하면 관련 .class 파일이 생성된 걸 보실 수 있습니다. .class 파일은 이클립스에서 소스파일을 생성하거나 저장할 때 이클립스에서 자동으로 생성 및 변경해줍니다. 위에서 언급한 바와 같이 만약 저 .class 파일을 삭제하면 아래와 같은 에러가 발생하게 됩니다. 하지만 삭제했다고 걱정하실 건 없습니다.
이클립스가 .class를 자동으로 관리해주기 때문에 만약 .class를 복원하고 싶다면 .java 파일을 약간 수정한 후 저장을 하면 자동으로 .class가 다시 생성됩니다. .class 파일은 기계어로 되어 있기 때문에 이클립스 확장 프로그램을 설치하거나 다른 방법을 사용하여 열어야 제대로 된 코드를 보실 수 있습니다.
정리해보자면, 바이너리 코드는 CPU가 이해할 수 있는 언어, 바이트 코드는 가상머신(ex. JVM)이 이해할 수 있는 언어입니다. 그리고 자바 컴파일러는 JVM이 이해할 수 있도록 소스파일(*.java)를 목적파일(*.class, 바이트파일)로 변환시켜주는 역할을 합니다.
하지만 .class 파일이 최종적으로 실행되는 파일은 아닙니다. .java 파일이 실행이 되려면 자바 컴파일러 다음으로 JVM을 거쳐야 합니다.
(바이너리 코드와 바이트 코드 관련 글)
Java Virtual Machine
JVM은 Java Virtual Machine의 약자로 번역하면 자바 가상 머신입니다. 가상머신은 프로그램을 실행 하기 위해 물리적 머신과 유사한 머신을 소프트웨어로 구현한 것으로 JVM 역시 컴파일러로 변환된 .class 파일을 Class Loader를 통해 읽어 들여 자바 API와 함께 실행시킵니다.
자바의 장점이라하면 운영체제의 구애를 받지 않는 다는 점, 메모리 관리가 용이하다는 점인데 이를 가능케 해주는 것이 바로 JVM 입니다.
JVM에서의 실행과정
- Class Loader를 통해 .class 파일들을 JVM에 올린다
- JVM에 있는 .class 파일들을 Execution Engine의 Interpreter와 JIT Complier를 통해 해석된다
- 해석된 바이트 코드는 Runtime Data Areas 에 배치되어 실질적인 수행이 이루어진다
JVM의 Class Loader는 동적 로딩을 통해 필요한 클래스들을 로딩 및 링크 하여 Runtime Data Area에 올립니다. 그후 Execution Engine은 JVM에 올라온 바이트 코드(.class)들을 명령어 단위로 하나씩 가져와서 실행시킵니다. Execution Engine은 Interpreter와 JIT compiler에 의해 동작합니다.
*링크 : 소스코드 양이 늘어남에 따라 한 파일에 모든 소스코드를 작성할 수 없게 되어 파일들은 분리해야 했는데, 이런 여러 소스파일들을 하나로 합치는 것, 그리고 이것을 수행하는 프로그램이 링커
들어가기 앞서Interpreter의 개념 대해 잠깐 알아보겠습니다.
Interpreter 란?
Interpreter(이하 인터프리터)는 컴파일러처럼 고레벨언어를 기계어(저레벨언어)로 해석해주는 번역 프로그램입니다. 컴파일러는 전체 소스코드를 보고 명령어를 수집하고 재구성하는 반면 인터프리터는 소스코드의 각 행을 연속적으로 분석하며 실행합니다. 때문에 일반적으로 각 행마다 실행하는 인터프리터보다는 컴파일러가 더 빠릅니다.
자바스크립트와 파이썬이 대표적인 인터프리터 언어고, C,C++은 컴파일언어, 자바는 컴파일러와 인터프리터 모두 해당됩니다.
JVM으로 다시 돌아와서 앞서 말씀드린 것처럼 인터프리터는 각 행마다 변환를 해주기 때문에 속도 측면에서 느립니다. 이를 개선하기 위하여 도입한 것이 바로 JIT compiler(Just-In-Time Compiler, 이하 JIT 컴파일러) 입니다.
인터프리터는 각 행마다 읽어 변환을 하고, JIT 컴파일러는 바이트 코드를 전체를 읽어 한꺼번에 변환을 합니다. 매번 코드를 한 줄씩 읽어 변환을 하게 되면, 아무래도 미리 컴파일된 코드를 수행하는 것보다 느릴수 밖에 없습니다. 그렇다고, 바이트 코드 전체를 프로그램 수행 초기에 모두 컴파일을 하게 되면 초기 속도가 너무 느리게 됩니다.
그렇기 때문에 모든 코드는 초기에 인터프리터에 의해 시작되고, 해당 코드를 충분히 많이 사용할 경우 JIT 컴파일러에서 컴파일을 수행하게 됩니다. 초기에 인터프리트 방식으로 바이트 코드를 변환하면서 그 코드를 캐싱하여, 같은 함수가 여러 번 불릴 때 매번 코드가 생성되는 것을 방지합니다.
이렇게 컴파일된 코드를 네이티브 코드 라고 하는데 네이티브 코드는 캐시에 보관되기 때문에 한번 컴파일된 코드는 빠르게 수행될 수 있습니다. JIT 컴파일러는 JVM의 핵심으로 JVM 내에서 성능에 가장 큰 영향을 줍니다. 따라서 튜닝을 수행하게 되는데 이는 아직 제 수준을 넘어서는 것 같아 이 글에서 다루진 않겠습니다.
Garbage Collector 또한 JVM에서 상당히 중요한 역할을 수행하는데 다른 글에서 자세히 다루고 이번 글에서는 간단히 설명하겠습니다.
Garbage Collector 란?
유효하지 않는 메모리, 즉 주소를 잃어버려서 사용할 수 없는 메모리를 Garbage 하는데 Garbage Collector는 메모리가 부족할 때 이런 Garbage 메모리에서 해제 시켜 다른용도로 사용할 수 있게 해주는 프로그램을 말합니다.
Garbage Collector를 수행할 땐 Garbage Collector를 수행하는 스레드를 제외한 모든 스레드들이 작업을 멈추고, 이후 완료되면 작업을 다시 시작합니다.
C, C++는 사용자가 메모리를 직접 해제해주어야 하지만 자바 같은 경우 Garbage Collector를 이 작업을 수행해줍니다.
주의할점은 메모리 누수까지 잡아주지는 않습니다.
*메모리 누수 : 프로그램 구동 중에 필요치 않은 메모리가 계속해서 점유하고 있는 현상
맺으며..
자바스크립트 작동과정에 이어 자바에서의 작동과정 또한 알아보았습니다.
- *.java가 자바 컴파일러에 의해 .class로 변환된다
- .class가 Class Loader로 인해 JVM에 로딩된다
- JVM의 인터프리터와 JIT 컴파일러에 의해 변환된 코드가 실행된다
대략 이렇게 알고 있으면 될것 같습니다.
다음에는 JIT 컴파일러, 가비지 콜렉터 등 JVM 내에서 중요한 역할을 수행하는 프로그램에 대해서 더 깊이있게 공부해보겠습니다.
Conference
- 자바의 작동원리
- JVM(Java Virtual Machine)이란 무엇인가?
- Java의 동작원리와 JVM의 역할
- 자바 JIT 컴파일러
- 자바 컴파일에 대한 이해
- 가비지 컬렉터(GC)에 대하여
- Java Garbage Collection
'...' 카테고리의 다른 글
[Java] 인터페이스와 추상클래스 (4) | 2021.06.01 |
---|---|
[AWS] EC2를 이용하여 Node.js 서버 배포하기 (4) | 2021.05.23 |
[CA] 바이너리 파일과 바이트 파일 그리고 컴파일, 링크 (4) | 2021.05.10 |
[JS]자바스크립트 동작의 삼위일체! - V8, Web API, Event Loop (7) | 2021.05.03 |
[OS] 더 이상 어버버하지말자!! 스레드와 프로세스 (13) | 2021.04.26 |