Rockchip공식대리점

Inanyou Show

Home

News & Notice / Q&A / Reference Document / Product Inquiry

Home > CS Center > News & Notice

News & Notice

로봇 산업은 계속해서 성장세를 보이고 있으며, RK의 풀스택 플랫폼 기능은 산업 현장의 효율적인 구현을 지원합니다.

서학진(hj.seo)

2026-03-27

Rockchip은 독일에서 열리는 임베디드 월드 2026에서 자사의 역량을 선보이며, 엣지 AI가 어떻게 산업 지능을 이끌어갈 수 있는지를 시연합니다.

서학진(hj.seo)

2026-03-20

Rockchip RK182X 주요 업데이트 | RKNN3 SDK V1.0.0 출시, 멀티모달 모델 완벽 지원!

서학진(hj.seo)

2026-03-20

락칩(Rockchip)은 RK1820/RK1828 AI 코프로세서용 RKNN3 SDK V1.0.0 공식 버전을 출시했습니다. 이 SDK는 RK3588/RK3576 + RK1820/RK1828 하드웨어 조합과 완벽하게 호환되며, 엣지 AI 모델 배포를 위한 풀 스택 소프트웨어 지원을 제공합니다. 성능, 모델 적응성, 기능 및 정확도 측면에서 대폭 업그레이드 되었으며, 고성능, 높은 적응성 및 에너지 효율성을 자랑합니다.

이 SDK는 PC 개발 키트, 온보드 런타임 API 및 모델 변환 배포 예제를 포함합니다. Android/Linux 시스템을 지원하며 고속 PCIe/USB 인터페이스를 활용하여 지연 시간이 짧은 데이터 상호 작용을 제공합니다. 주요 기능으로는 최적화된 핵심 기능이 있습니다.

1. 추론 효율성 향상: 병렬 데이터 전송 및 추론을 지원하고, 핵심 연산자를 최적화 하며, 여러 코어와 모델에 걸쳐 동시 추론을 위한 높은 동시성에 적응합니다.

2. 대규모 모델에 대한 향상된 적응성: mRoPE 및 함수 호출을 지원하며, 주요 대규모 모델 기능과 호환됩니다.

3. 개발 및 배포 용이성 향상: 지속적인 보드 정확도 분석을 지원하고, 경량 Python API 툴킷을 제공하며, 코프로세서를 이용한 사용자 정의 모델 후처리 기능을 제공하고, rkllm3 서버에 임베디드 모델 지원을 추가합니다.

핵심 성능 도약! LLM 디코딩 효율 15% 이상 향상, 3B 모델 100 TPS 돌파 및 최대 8B 지원

이번 공식 SDK 릴리스의 핵심적인 혁신 중 하나는 LLM 디코딩의 전반적인 성능이 15% 이상 향상되었다는 점입니다. 0.5B에서 8B에 이르는 다양한 파라미터 레벨을 가진 LLM 모델에 대한 심층적인 적응 및 최적화를 완료했습니다. RK1820/RK1828은 컴퓨팅 성능 특성에 따라 다르게 적용되어 다양한 엣지 시나리오의 LLM 추론 요구 사항을 충족할 수 있습니다.

테스트 데이터에 따르면 RK182X는 특히 경량 LLM 모델에서 뛰어난 성능을 보여줍니다. 3B급 모델은 디코딩 TPS가 100을 넘어서는 획기적인 성과를 달성했으며 , Qwen2.5-3B 모델은 디코딩 TPS 102.01을 기록하여 엣지 환경에서 대규모 모델의 실시간 상호 작용을 효율적으로 지원합니다. 초경량 Qwen2.5-0.5B 모델 또한 TTFT 21.89ms, TPOT 4.63ms, 디코딩 TPS 215.86이라는 탁월한 성능을 보여줍니다. 중대형 LLM 모델의 경우, Qwen3-8B는 RK1828에서 61.11의 디코딩 TPS로 안정적인 추론을 달성하여 엣지 환경에서 중대형 LLM 모델을 배포하는 데 필요한 모든 조건을 충족합니다.

RK182X에서 서로 다른 파라미터 세트를 사용한 LLM 모델의 핵심 성능 데이터는 다음과 같습니다.

VLM 모델 성능: 다중 모달 추론에서 높은 효율성과 안정성

동일한 표준 테스트 환경에서 RK182X는 여러 주요 VLM 및 멀티모달 모델에 대한 심층 추론 최적화를 완료했습니다. RK1820/RK1828은 컴퓨팅 성능 특성에 따라 차별화된 적응성을 구현하여 다양한 시각 해상도에서도 안정적인 시각 추론 시간을 유지하고, LLM 디코딩 성능 또한 매우 효율적입니다. 특히 Qwen3-VL 시리즈 모델을 완벽하게 지원하며, Qwen3-VL-4B의 LLM 디코딩 TPS는 약 90TPS에 달합니다 . RK1828은 중대형 VLM 모델에 대해 완전한 코프로세서 측 추론을 수행할 수 있으며, 멀티모달 상호작용 성능 또한 탁월합니다.

RK182X의 다양한 VLM 모델에 대한 핵심 성능 데이터는 다음과 같습니다.

RK1828은 Qwen2.5-Omni-3B 멀티모달 모델과 완벽하게 호환되어 전체 시청각 및 언어 처리 체인에서 효율적인 추론을 가능하게 합니다. 디코딩 TPS는 102.63에 달하여 100을 돌파했습니다. 추론은 전체 코프로세서 측에서 독립적으로 완료되며, 392*392 영상 해상도에서 안정적인 추론 시간을 보이고, 오디오 추론 시간은 단 98.91ms에 불과하여 탁월한 멀티모달 처리 효율성을 입증합니다.

CNN 모델 성능: 단일 코어 컴퓨팅 성능이 우수하며, 멀티 코어 및 배치 처리에서 처리량이 크게 향상되었습니다.

RK182X는 싱글 코어 모드와 멀티 배치 멀티 코어 모드 모두에서 기존 분류 및 객체 탐지 CNN 모델에 대한 심층 추론 최적화를 수행합니다. 여러 코어와 모델에 걸쳐 동시 추론이 가능하다는 장점을 활용하여 컴퓨팅 성능을 극대화하며, 특히 DINOv3에서 뛰어난 ViT 성능을 보여줍니다. 싱글 코어 성능은 안정적으로 유지하면서 멀티 배치 멀티 코어 모드에서는 프레임률을 수 배 향상시킵니다. 높은 처리량 특성 덕분에 지능형 모니터링 및 산업 검사와 같은 고동시성 컴퓨터 비전 애플리케이션에 효율적으로 적응하여 성능과 에너지 효율성의 균형을 이룹니다.

RK182X에서 다양한 CNN 모델의 핵심 성능 데이터는 다음과 같습니다.

거의 손실 없는 정확도! 양자화 최적화로 "정확도 손실 없이 성능 향상"을 달성했습니다.

RKNN3 SDK V1.0.0은 모델 유형에 따라 서로 다른 양자화 전략을 사용합니다. LLM/VLM 모델은 W4A16 G32 양자화 전략을 사용하고, CNN 모델은 W8A8 양자화 전략을 사용합니다. 이를 통해 추론 성능이 크게 향상되면서도 기존 float32 버전과 비슷한 정확도를 유지하고, 일부 모델은 오히려 정확도를 능가합니다. 따라서 정확도 손실을 효과적으로 제어하여 결과 품질 저하 없이 진정한 성능 향상을 달성할 수 있습니다.

견고한 엔드투엔드 모델 생태계 레이아웃은 AIoT 2.0의 감지, 의사 결정 및 실행 기능을 강화합니다.

RKNN3 SDK V1.0.0은 AIoT 2.0의 핵심 아키텍처인 인지-결정-실행을 면밀히 따르며, 30개 이상의 주요 AI 모델을 완벽하게 지원합니다. 또한, 핵심 파트너들과 긴밀히 협력하여 하드웨어 컴퓨팅 성능, 소프트웨어 스택, 알고리즘 모델 간의 생태계 장벽을 허물고, 완벽한 모델 지원과 뛰어난 적응성을 제공하며, RK182X 코프로세서의 컴퓨팅 성능을 최대한 활용할 수 있도록 합니다.

인지 계층에서는 멀티모달 데이터 수집 기능을 극대화하고, 선도적인 파트너사의 모델들을 심층적으로 적용했습니다. 엣지 환경에 멀티모달 지능형 데이터 입력 지점을 구축하여, 시각 영역에서는 기존 CNN 시각 모델과 Mobilenet, YOLO 시리즈와 같은 깊이 추정 모델을 완벽하게 활용했습니다. 음성 영역에서는 iFlytek, Speechocean, Elephant Acoustics 등 인지 계층의 선도적인 파트너사와 긴밀히 협력 하여 ASR, TTS와 같은 핵심 음성 모델을 적용하고, 멀티모달 인지 기능을 효율적으로 구현했습니다.

의사결정 단계에서는 주요 벤더의 핵심 모델을 하나씩 적용한, 완전한 사양의 모델들로 구성된 폐쇄형 생태계를 구축합니다 . Qwen3-VL 및 GLM Edge와 같은 주류 오픈 소스 대형 모델에 맞춰 조정되었으며, 0.5B~8B 규모의 완전한 사양의 LLM 모델과 완벽하게 호환됩니다. 또한 Qwen2.5-Omni-3B, Zhipu MiniCPM, Step-GUI-Edge와 같은 주요 벤더의 핵심 모델들을 심층적으로 적용 하여 엣지에서 효율적인 풀모달 지능형 의사결정 기능을 구현합니다.

실행 계층에서 소프트웨어와 하드웨어의 협업은 시나리오 구현을 강화하고 전체 모델 기능 변환 체인에 적응합니다 . RK3588/RK3576+RK182X 하드웨어 및 소프트웨어 조합을 활용하여 코프로세서를 통한 맞춤형 모델 후처리를 지원하고, 다양한 모델 결정 결과의 실행 로직에 유연하게 적응합니다. 또한 Android/Linux 시스템과 호환되어 스마트 하드웨어 및 산업 검사와 같은 다양한 시나리오에서 모든 범주에 걸쳐 AI 기능을 원활하게 구현하고 알고리즘에서 응용 프로그램까지 완벽한 변환을 달성합니다.

또한 SDK는 Hugging Face, ModelScope, GitHub와 같은 오픈 소스 플랫폼과 완벽하게 호환되며, 사용자는 GitHub에서 사전 변환된 RKNN 모델을 직접 얻을 수 있습니다.

• 모델 Zoo 주소: https://github.com/airockchip/rknn3-model-zoo;

• 도구 추출 주소: https://github.com/airockchip/rknn3-toolkit;

RK1820/RK1828 RKNN3 SDK V1.0.0 공식 버전 출시는 락칩이 엣지 AI 코프로세서 분야에서 이룬 중요한 도약입니다. 성능 향상, 모델 확장, 정확도 최적화 등 모든 업데이트는 개발자의 실제 배포 요구 사항에 맞춰 설계되었으며, RK182X의 강력한 컴퓨팅 성능과 에너지 효율성을 최대한 활용할 수 있도록 지원합니다. 락칩은 앞으로도 RKNN3 SDK를 지속적으로 개선하고 최적화하여 지원 모델 범위를 꾸준히 확대하고 컴퓨팅 성능을 향상시켜 더욱 효율적인 엣지 AI 개발 툴체인을 구축하고, 더 많은 혁신적인 AI 애플리케이션이 엣지 환경에 배포될 수 있도록 도울 것입니다.

Rockchip 제1회 AI 소프트웨어 생태계 컨퍼런스 개최

서학진(hj.seo)

2026-03-05

Rockchip의 RK182X는 주류 멀티모달 대형 모델과 완벽하게 호환되어 엣지 AI 생태계의 발전을 선도.

서학진(hj.seo)

2026-03-05

CES 2026 트렌드가 현실이 되다: RK182X 컴퓨팅 엔진이 산업을 재편하고, 락칩 AI 생태계 컨퍼런스에서 구현 생태계를 공동으로 구축하다

서학진(hj.seo)

2026-03-05

Rockchip AI 소프트웨어 에코시스템 컨퍼런스가 곧 시작됩니다. AIoT 2.0 시대를 함께 경험해 보세요!

서학진(hj.seo)

2026-03-05

CES 2026 | 락칩은 AI를 활용한 IoT의 다양한 시나리오 업그레이드를 위한 혁신적인 솔루션을 선보입니다.

서학진(hj.seo)

2026-03-05

100% 중국 설계 칩을 탑재한 최초의 신에너지 자동차! 락칩의 듀얼 칩이 장착된 하오보 GT-클라이밍 에디션이 공식적으로 생산 라인에서 출고됩니다.

서학진(hj.seo)

2025-12-18

RKDC!2025 (Rockchip Developer Conference) 개최

서학진(hj.seo)

2025-07-21

발표 내용	주요 사례 및 특성
RK3688 신형 SoC	12코어 Armv9, 32TOPS NPU, 8K 영상처리 지원, AI·머신비전·고성능 컴퓨팅 분야 적용
RK182X LLM/VLM 코프로세서	최대 7B 파라미터 대형 언어/비전 모델 처리, RKNN3 툴킷, PyTorch/ONNX/TensorFlow 지원
AIoT 산업 응용	자동차 전자, 소비자 가전, 스마트시티, 엣지 AI 활용 등 다양한 산업 분야 레퍼런스 및 솔루션 공개