采用此控制策略消除因片外的數(shù)據(jù)存取瓶頸而引起的DSP內(nèi)核等待。DSP實(shí)時(shí)仿真表明,經(jīng)這種流程優(yōu)化,運(yùn)動(dòng)搜索部分運(yùn)算時(shí)間下降了近1/3.另外,為進(jìn)一步加快運(yùn)動(dòng)搜索的速度,對(duì)原搜索算法中的運(yùn)動(dòng)矢量預(yù)測(cè)進(jìn)行改進(jìn)。原搜索算法5個(gè)候選矢量的選擇僅利用物體運(yùn)動(dòng)的空間連續(xù)性。
在改進(jìn)的運(yùn)動(dòng)矢量預(yù)測(cè)中,利用運(yùn)動(dòng)時(shí)間連續(xù)性增加1個(gè)候選矢量。根據(jù)運(yùn)動(dòng)慣性,前一幀中與當(dāng)前幀當(dāng)前塊位置相同的對(duì)應(yīng)塊周圍有8個(gè)塊,沿著各自的運(yùn)動(dòng)矢量運(yùn)動(dòng)后與當(dāng)前塊重合的可能性大。因此,選擇8個(gè)塊中運(yùn)動(dòng)后與當(dāng)前塊重合最多的塊的運(yùn)動(dòng)矢量作為當(dāng)前塊運(yùn)動(dòng)矢量的第6個(gè)候選矢量。經(jīng)改進(jìn)后,對(duì)foreman圖像序列測(cè)試統(tǒng)計(jì),85%以上的塊搜索次數(shù)小于6次,即絕大多數(shù)塊會(huì)在6個(gè)候選矢量中找到最佳匹配,而不用進(jìn)行菱形搜索,運(yùn)算量大大減少。
匯編代碼優(yōu)化Blackfin處理器具有強(qiáng)大的并行處理能力,一條32位長(zhǎng)的乘加指令可以和2條16位長(zhǎng)的算術(shù)指令或LOAD/STORE指令同時(shí)執(zhí)行。這就可以在CPU對(duì)當(dāng)前數(shù)據(jù)進(jìn)行操作的同時(shí),從存儲(chǔ)器中取出下次運(yùn)算所需的操作數(shù),以減少處理器內(nèi)核的等待時(shí)間,提高內(nèi)核資源的使用率。