OpenAI představuje open-weight modely AI pro bezpečnost vývojářů

OpenAI dává více bezpečnostních kontrol přímo do rukou vývojářů AI s novým výzkumným náhledem modelů „safeguard“.

Nová rodina open-weight modelů ‚gpt-oss-safeguard‘ je zaměřena přímo na přizpůsobení klasifikace obsahu. Nová nabídka bude zahrnovat dva modely, gpt-oss-safeguard-120b a menší gpt-oss-safeguard-20b. Oba jsou vyladěné verze existující rodiny gpt-oss a budou dostupné pod permisivní licencí Apache 2.0. To umožní jakékoli organizaci volně používat, upravovat a nasazovat modely podle svých potřeb.

Skutečný rozdíl zde není jen v otevřené licenci; je to metoda. Místo spoléhání se na pevný soubor pravidel zapečených v modelu používá gpt-oss-safeguard své schopnosti uvažování k interpretaci vlastní politiky vývojáře v okamžiku inference. To znamená, že vývojáři AI používající nový model OpenAI mohou nastavit svůj vlastní specifický bezpečnostní rámec pro klasifikaci čehokoli od jednotlivých uživatelských dotazů až po kompletní historie chatů. Vývojář, nikoli poskytovatel modelu, má poslední slovo ohledně pravidel a může je přizpůsobit svému konkrétnímu případu použití.

Tento přístup má několik jasných výhod:

Transparentnost: Modely používají proces řetězce myšlenek, takže vývojář může skutečně nahlédnout pod kapotu a vidět logiku modelu pro klasifikaci. To je obrovský krok vpřed oproti typickému klasifikátoru „černé skříňky“.

Agilita: Protože bezpečnostní politika není trvale natrénována do nového modelu OpenAI, mohou vývojáři iterovat a revidovat své pokyny průběžně bez potřeby kompletního cyklu přetrénování. OpenAI, které původně vytvořilo tento systém pro své interní týmy, poznamenává, že toto je mnohem flexibilnější způsob, jak řešit bezpečnost, než trénování tradičního klasifikátoru, aby nepřímo odhadoval, co politika implikuje.

Místo spoléhání se na univerzální bezpečnostní vrstvu od držitele platformy mohou nyní vývojáři používající open-source modely AI vytvářet a prosazovat své vlastní specifické standardy.

I když v době psaní ještě nejsou živé, vývojáři budou moci přistupovat k novým open-weight modelům AI pro bezpečnost od OpenAI na platformě Hugging Face.

Zdroj: ainews.co.uk

 

Zdroj: RESELLER CHANNEL NETWORK NEWS