HW-Aware Neural Architecture Search
(하드웨어를 고려한 AI 모델 구조 탐색)
뉴럴 구조 탐색 (NAS)은 인간의 개입 없이 최적의 신경망 구조를 자동으로 찾는 기법입니다. 우리는 기존의 NAS를 넘어서 하드웨어에 최적화 된 신경망 구조를 찾는 HW-Aware NAS 연구를 수행합니다.
Neural architecture search (NAS) provides a way to automatically find a highly accurate NN model without human intervention. However, the conventional NAS approaches come with a major flaw; they focus on increasing only prediction accuracy without considering computational cost of NN inference. This will make NAS impractical in many cases such as execution on mobile devices where computational capacity is limited. Correspondingly, hardware-aware NAS approaches are gaining attention recently as they generate network architectures that can be executed in hardware efficiently maintaining the prediction accuracy.
Your Job 연구실에 들어오면 하게 될 일
Related Keywords 연관 키워드
HW-Aware NAS, Neural Architecture Search, Deep Learning, Computer Architecture
하드웨어를 고려한 NAS, 신경망 구조 탐색, 딥러닝, 컴퓨터구조
Hardware/Software Co-Design
(AI 하드웨어/소프트웨어 공동 설계)
AI 모델은 크기가 점점 커지는 반면에, 하드웨어 성능 향상 폭은 줄어들고 있습니다. 이러한 상황에서 AI 모델을 빠르게 동작시키기 위해 하드웨어와 소프트웨어를 동시에 고려하여 설계하는 연구를 수행합니다.
The end of Moore’s law is forcing us to establish new boundaries between hardware and software particularly in the emergence of deep learning. Hardware/Software co-designing will provide more optimization room for efficient deep learning acceleration.
Selected Publication
Your Job 연구실에 들어오면 하게 될 일
Related Keywords 연관 키워드
Quantization, Structured Sparsity, Pruning, Model Compression
양자화, 구조적 희소성, 가지치기, 모델 경량화
Neural Processing Unit HW/SW Design
(뉴럴 프로세싱 유닛 HW/SW 설계)
AI 모델을 빠르고 에너지 효율적으로 동작시키는 하드웨어인 NPU의 HW구조 및 SW를 연구합니다.
We design a high-performance, energy-efficient Neural Processing Unit (NPU), a new type of processor dedicated for a wide range of AI workloads. It generally exploits the high degree of parallelism inherent in deep learning algorithms.
Selected Publication
Your Job 연구실에 들어오면 하게 될 일
Related Keywords 연관 키워드
NPU, TPU, Neural Compiler, Processing-in-Memory, Computer Architecture, Digital Logic Design
뉴럴프로세싱유닛, 텐서프로세싱유닛, 뉴럴 컴파일러, 메모리내부연산, 컴퓨터구조, 디지털논리설계