create-environments

Name: create-environments
Author: PrimeIntellect-ai

autor: PrimeIntellect-ai

Buduj środowiska ewaluacyjne dla ekosystemu Prime Lab – od zera do produkcji

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: PrimeIntellect-ai
Kategoria: Mobile

Repozytorium GitHub

O skillu

Skill do tworzenia i migracji środowisk weryfikacyjnych w Prime Lab. Pozwala budować nowe środowiska od podstaw, przenosić benchmarki z artykułów naukowych, startować z istniejących środowisk z Hub lub konwertować zadania w pakiety gotowe do instalacji. Każde środowisko pracuje natychmiast: instaluje się, ładuje, ewaluuje i trenuje bez ukrytych zależności. Obsługuje zarówno proste zadania jednokrokowe, jak i złożone interakcje wieloturowe z narzędziami.

Jak używać

Zacznij od inicjalizacji nowego środowiska komendą prime env init my-env, a następnie zainstaluj je za pomocą prime env install my-env. Jeśli chcesz startować z istniejącego środowiska, wyszukaj je komendą prime env list --search "słowo kluczowe" i zainstaluj wybraną opcję.
Przed budowaniem środowiska od zera zdefiniuj kontrakt zadania: kształt promptu, dostępne narzędzia, warunki zatrzymania, format wyników rubryk i metryki ewaluacji. Wybierz odpowiednią klasę bazową – SingleTurnEnv dla zadań jednokrokowych, MultiTurnEnv dla pętli interakcji, ToolEnv lub MCPEnv dla narzędzi bezstanowych, StatefulToolEnv dla zasobów per-rollout.
Uruchom ewaluację komendą prime eval run my-env -m gpt-4.1-mini -n 5. Ta komenda jest kanonicznym sposobem ewaluacji i automatycznie zapisuje wyniki – nie dodawaj --skip-upload chyba że użytkownik wyraźnie tego zażąda.
Przed testowaniem wybierz typ modelu: dla smoke testów preferuj modele instruct (seria gpt-4.1, qwen3 instruct), dla walidacji z rozumowaniem użyj gpt-5, qwen3 thinking lub glm.
Przechowuj aliasy endpointów w pliku configs/endpoints.toml, aby smoke testy mogły szybko przełączać się między modelami bez ręcznych zmian konfiguracji.

Podobne skille

openscad

autor: mitsuhiko

Twórz i renderuj modele 3D w OpenSCAD, generuj podglądy i eksportuj do druku 3D

Mobile

4291

kotlin-multiplatform

autor: vitorpamplona

Decyzje architektoniczne dla Kotlin Multiplatform – kiedy dzielić kod między platformy, a kiedy trzymać osobno.

Mobile

15105

swift-best-practices

autor: sammcj

Pisz bezpieczny kod Swift 6+ z nowoczesnymi wzorcami współbieżności i API design

Mobile

36140

android-kotlin-development

autor: aj-geddes

Twórz natywne aplikacje Android w Kotlinie z architekturą MVVM i nowoczesnym interfejsem

Mobile

152396

mobile-ios-design

autor: wshobson

Projektuj natywne aplikacje iOS zgodnie z wytycznymi Apple, używając SwiftUI i nowoczesnych wzorców.

Mobile

107284

interactive-portfolio

autor: davila7

Portfolio, które przyciąga rekruterów i klientów — nie tylko galeria, ale doświadczenie

Mobile

1823