面向聯(lián)邦學(xué)習(xí)激勵優(yōu)化的演化博弈模型
小型微型計算機系統(tǒng)
頁數(shù): 8 2023-02-07
摘要: 針對聯(lián)邦學(xué)習(xí)中參與者虛報訓(xùn)練成本導(dǎo)致激勵不匹配的現(xiàn)象,提出了面向聯(lián)邦學(xué)習(xí)激勵優(yōu)化的演化博弈模型.首先在聯(lián)邦學(xué)習(xí)系統(tǒng)中建立了聯(lián)邦參與者-聯(lián)邦組織者演化博弈模型,設(shè)計模型質(zhì)量評估算法對參與者提交的模型進行質(zhì)量評估,去除低質(zhì)量模型的同時量化參與者訓(xùn)練成本.然后結(jié)合信譽度指標(biāo)提出優(yōu)化的激勵分配方法,通過求解演化博弈的穩(wěn)定策略得到不同初始狀態(tài)下的最優(yōu)收益策略.最后仿真實驗表明參與者激勵收...