自然語言文本水印
應(yīng)用背景:數(shù)字作品極易被盜版者抄襲和篡改,嚴(yán)重侵害擁有者的知識(shí)產(chǎn)權(quán);此外,網(wǎng)絡(luò)上數(shù)字內(nèi)容泛濫,很難對(duì)內(nèi)容的來源進(jìn)行確認(rèn)。因此,研究文本水印實(shí)有必要,這對(duì)于確認(rèn)信息來源和信息的秘密傳送,以及版權(quán)維護(hù)等方面都有著很大的應(yīng)用價(jià)值 。
解決方案:基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)研究(生成式)自然語言文本水印。
核心技術(shù):
(1)注意力機(jī)制:利用關(guān)鍵詞引導(dǎo)語言模型生成長(zhǎng)文本,提高嵌入容量。
(2)自適應(yīng)候選詞替換:依照候選詞的概率選擇最合適的詞作為當(dāng)前輸出,能夠充分利用數(shù)據(jù)承載空間。
(3)主題感知損失設(shè)計(jì):面對(duì)未知測(cè)試環(huán)境,引導(dǎo)模型生成與主題相關(guān)的文本,泛化能力強(qiáng),穩(wěn)健性好。