Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Skill do tworzenia i integracji nowych RolloutWorkflow w frameworku AReaL. Zawiera kompletny przewodnik od przygotowania pliku Python, przez zdefiniowanie funkcji nagrody, aż do uruchomienia pierwszego epizodu. Przeznaczony dla deweloperów, którzy chcą rozszerzyć system o własne strategie rollout'u. Obejmuje szablony kodu, wymagane importy i strukturę asynchroniczną.
Jak używać
Przygotuj wymagania — zanim zaczniesz, jasno zdefiniuj cel przepływu pracy, format danych wejściowych i wyjściowych oraz funkcję nagrody, którą będziesz używać.
Utwórz plik workflow — stwórz nowy plik Python w katalogu
areal/workflow/o nazwie odpowiadającej Twojemu przepływowi (np.areal/workflow/moj_workflow.py).Zaimplementuj klasę RolloutWorkflow — utwórz klasę dziedziczącą po
RolloutWorkflowz metodą__init__przyjmującąGenerationHyperparameters, tokenizer i funkcję nagrody. Zapisz konfigurację, tokenizer i opakuj funkcję nagrody wAsyncRewardWrapper.Zdefiniuj metodę arun_episode — implementuj asynchroniczną metodę
arun_episodeprzyjmującąInferenceEnginei słownik danych. Metoda musi być nieblokująca i zwracać słownik tensorów PyTorch.Przygotuj dane wejściowe — wewnątrz
arun_episodeprzekształć dane z parametrudatanainput_idsużywająctokenizer.apply_chat_template()z flagąadd_generation_prompt=True.Zbuduj i wyślij żądanie — utwórz obiekt
ModelRequestz unikalnym identyfikatorem, przygotowanymiinput_idsi konfiguracją generacji, następnie wyślij go do silnika inferencji i obsłuż odpowiedź.