- 많은 AI 조종사는 실제 운영에 실패하고 게니 조종사의 95%가 생산에 도달하지 못하다고 Salesforce는 주장합니다.
- Krmerena-Pro
- 스트레스 테스트 AI 에이전트에는 두 가지 새로운 벤치 마크가 사용됩니다
Salesforce는 기업이 실제 세계에서 일하지 않은 AI 조종사와 어려움을 겪고 있으며 Kremerena-Pro를 시작했으며, 이는 스트레스 테스트 AI 에이전트가 비즈니스를 배포하기 전에 디지털 쌍둥이를 만들 수있는 새로운 서비스입니다.
이 회사는 최근 MIT 연구를 인용하여 AI 조종사 생성의 95%가 생산 단계에 도달하지 못했다고 진술했다.
Kremena-Pro는 고객 서비스, 판매 예측 및 공급망 장애와 같은 실제 작업에 대한 AI 에이전트를 평가하지만 전문가가 인식하는 인공 데이터를 사용합니다.
Salesforce는 디지털 쌍둥이를 사용하여 AI 에이전트를 스트레스 테스트 할 수 있습니다.
이 회사는 “Kremenena-Pro가 인공 데이터를 통해 엄격하고 풍부한 시뮬레이션 된 엔터프라이즈 환경 프레임 워크를 만들어 관련 시스템의 통화를 안전하게 평가할 수 있으며 PII 데이터를 보호 할 수있는 능력”이라고 선언했다.
Kremerena-Pro는 실제 사운드를 테스트 환경에 추가함으로써 영향을 더 잘 평가하고 탄력을 강화하며 사전과 후속 배치 사이의 간격을 제거 할 수 있습니다.
“결과는 유능하고 관련성이 높고 신뢰할 수 있고 에이전트 엔터프라이즈 준비가 된 AI 에이전트입니다.”
회사는 AI 에이전트가 지저분한 데이터, 레거시 시스템 및 복잡한 워크 플로와 같은 실제 과제를 처리하는 방법을 확인할 수 있습니다.
Salesforce는 복잡성의 일부는 오늘날 선택할 수있는 다양한 모델에서 비롯되며 특정 모델이나 모델의 조합을 사용하기는 쉽지 않습니다.
이 회사는 에이전트의 영향을 측정하기 위해 두 가지 새로운 벤치 마크를 발표했습니다. 인공 기능 및 MCP-Beasts의 평가를위한 MCP-Aval은 복잡한 관점에서 스트레스 에이전트에 실제 작업 및 실행 기반 평가자를 추가합니다.
이전 게시물에서 Salesforce는 Krmerena -Pro가 “다가오는 프론티어 : Enterprise General Intelligence”를 지원합니다. 현재 사용자는 모든 조직에 “안전하고 유능하며 효과적인”AI를 기대할 수 있습니다.