第47屆VLDB2021大會在丹麥哥本哈根舉行
當(dāng)?shù)貢r間8月16日至20日,第47屆VLDB 2021大會在丹麥哥本哈根舉行。
VLDB會議的全稱是超大型數(shù)據(jù)庫國際會議,是數(shù)據(jù)庫領(lǐng)域的頂級學(xué)術(shù)會議另外兩大數(shù)據(jù)庫會議SIGMOD和ICD共同構(gòu)成了數(shù)據(jù)庫領(lǐng)域的三大頂級會議
按照慣例,今年的VLDB會議設(shè)立了最佳研究論文獎和最佳學(xué)術(shù)論文獎,b論文獎,最佳可擴(kuò)展數(shù)據(jù)科學(xué)論文獎,最佳工業(yè)論文獎等諸多獎項(xiàng)。在此之前,中國學(xué)者在這一領(lǐng)域騎行,今年也不例外!
《人工智能科技評論》對獲獎的中國學(xué)者和論文信息介紹如下:
最佳研究論文獎
獲獎?wù)撐摹禨caling Attributed Network Embedding to Massive Graphs》
個人主頁:點(diǎn)擊打開
論文地址:點(diǎn)擊打開
論文摘要:
屬性網(wǎng)絡(luò)嵌入是獲得精確預(yù)測的一項(xiàng)具有挑戰(zhàn)性的任務(wù),但將有效的ANE計算擴(kuò)展到包含數(shù)百萬個節(jié)點(diǎn)的海量圖,將它的難度推向了一個新的高度現(xiàn)有的解決方案基本上在這個圖上失敗,或者導(dǎo)致高成本,低質(zhì)量的嵌入,或者兩者兼而有之
本文提出了一種有效的,可擴(kuò)展的計算海量地圖的PANE方法,該方法在多個基準(zhǔn)數(shù)據(jù)集上達(dá)到了最高的性能水平其度量標(biāo)準(zhǔn)包括三種常見預(yù)測任務(wù)的準(zhǔn)確性:屬性推理,鏈路預(yù)測和節(jié)點(diǎn)分類尤其是PANE是目前已知唯一可行的大MAG數(shù)據(jù)解決方案,節(jié)點(diǎn)超過5900萬,邊數(shù)超過9.8億,屬性超過2000個,可以在12小時內(nèi)有效嵌入到單臺服務(wù)器上
PANE通過三個主要算法的設(shè)計,實(shí)現(xiàn)了較高的可擴(kuò)展性和有效性首先,基于一種新的屬性隨機(jī)游走模型,提出了學(xué)習(xí)目標(biāo),但在處理大型圖的優(yōu)化任務(wù)時仍然具有挑戰(zhàn)性其次,PANE為解決優(yōu)化問題提供了高效的求解器,其關(guān)鍵模塊在于設(shè)計良好的嵌入初始化,大大減少了收斂所需的迭代次數(shù)最后,PANE通過上述求解器的非線性并行化,利用多核CPU,從而實(shí)現(xiàn)可擴(kuò)展性,保留高質(zhì)量的嵌入結(jié)果通過廣泛的實(shí)驗(yàn),在8個真實(shí)數(shù)據(jù)集上對比了10種現(xiàn)有方法,證明PANE在結(jié)果質(zhì)量上優(yōu)于所有現(xiàn)有方法,速度快幾個數(shù)量級
最佳EAamp論文獎
獲獎?wù)撐?《Are We Ready For Learned Cardinality Estimation?!?/p>
個人主頁:點(diǎn)擊打開
論文地址:點(diǎn)擊打開
論文摘要:
基數(shù)估計是查詢優(yōu)化中一個長期未解決的基本問題最近,來自不同研究小組的許多論文一致指出,基于學(xué)習(xí)的模型可能會取代現(xiàn)有的基數(shù)估計器對此,我們提出了一個前瞻性的問題:基于學(xué)習(xí)模型的基數(shù)估計方法能否應(yīng)用于真實(shí)的數(shù)據(jù)庫產(chǎn)品本文的研究包括三個主要部分:第一,聚焦于靜態(tài)環(huán)境,在統(tǒng)一的工作量設(shè)置下,比較了不同學(xué)習(xí)方法和傳統(tǒng)方法在四個真實(shí)數(shù)據(jù)集上的性能,結(jié)果表明,基于學(xué)習(xí)的方法比傳統(tǒng)方法更準(zhǔn)確,但需要更高的訓(xùn)練成本和推理成本第二,基于學(xué)習(xí)的方法是否可以用于動態(tài)環(huán)境實(shí)驗(yàn)表明,它們跟不上快速更新數(shù)據(jù)的變化,可能會造成較大的誤差
基于學(xué)習(xí)的方法中幾種可能錯誤的現(xiàn)場研究我們發(fā)現(xiàn)相關(guān)性,分配或域大小的變化將極大地影響該方法的性能更重要的是,這些方法的行為往往難以解釋和預(yù)測基于上述發(fā)現(xiàn),我們確定了未來需要進(jìn)一步研究的兩個方向,即如何降低學(xué)習(xí)模型的成本和如何提高模型的可信度
導(dǎo)研究人員和從業(yè)人員共同合作,將基于學(xué)習(xí)到的基數(shù)估計器應(yīng)用到真正的數(shù)據(jù)庫系統(tǒng)中。
最佳可擴(kuò)展數(shù)據(jù)科學(xué)論文獎
獲獎?wù)撐?《Optimizing Bipartite Matching in Real—World Applications by Incremental Cost Computation》
論文地址:點(diǎn)擊打開
論文摘要:
Kuhn—Munkres 算法是一種經(jīng)典的組合優(yōu)化算法,在交通等諸多應(yīng)用場景中被廣泛用于最小成本的二部匹配例如,網(wǎng)約車服務(wù)可以用它來匹配司機(jī)和乘客,以盡可能地縮短等待時間通常情況下,給定的兩個二部集合,需要計算所有二部對之間邊的成本并找到最優(yōu)匹配可是,現(xiàn)有研究忽略了邊成本計算對整體運(yùn)行時間的影響實(shí)際上,邊計算會大大超過最優(yōu)分配本身的計算,例如在為乘客匹配司機(jī)時,最短路徑往往需要很高的計算成本根據(jù)這一觀察,我們發(fā)現(xiàn),常見的現(xiàn)實(shí)世界的設(shè)置表現(xiàn)出一個有用的特性,即允許我們僅在需要時使用最低的下限啟發(fā)式增量計算邊成本與原始 KM 算法相比,這種技術(shù)顯著降低了分配的總體成本,這一點(diǎn)我們已經(jīng)在多個真實(shí)數(shù)據(jù)集,工作負(fù)載上得到了驗(yàn)證此外,該算法并不限于這個領(lǐng)域,它還可能適用于其他有下限啟發(fā)式算法的環(huán)境
最佳工業(yè)論文獎
獲獎?wù)撐?《RAMP—TAO: Layering Atomic Transactions on Facebook's Online TAO Data Store》
論文一作 Audrey Cheng 目前是加州大學(xué)伯克利分校計算機(jī)科學(xué)專業(yè)在讀博士生,RISELAB 成員,師從 Ion Stoica 教授和 Natacha Crooks 教授,曾獲得伯克利校長獎學(xué)金,對數(shù)據(jù)庫與分布式系統(tǒng)感興趣。
個人主頁:點(diǎn)擊打開
論文地址:點(diǎn)擊打開
論文摘要:
與其他分布式數(shù)據(jù)存儲一樣,F(xiàn)acebook 社交圖譜 TAO 會優(yōu)先考慮可用性,效率和可擴(kuò)展性等因素,而不是滿足大型,可讀性強(qiáng)的工作負(fù)載所需要的一致性或保密性伴隨著產(chǎn)品開發(fā)人員在此系統(tǒng)上構(gòu)建不同的應(yīng)用程序,他們開始更多地關(guān)注業(yè)務(wù)語義可是,為選定的應(yīng)用程序提供高級功能,同時保持系統(tǒng)整體的可靠性和性能一直是一項(xiàng)挑戰(zhàn)在本文中,我們首先描述了開發(fā)者多年來的業(yè)務(wù)需求,以及目前 TAO 出現(xiàn)的原子級錯誤,以此探討了如何引入一個直觀的讀取業(yè)務(wù) API我們通過對潛在異常的測量研究,強(qiáng)調(diào)了 API 原子級可見性的必要性,這些異常通常在沒有強(qiáng)讀取隔離的情況下發(fā)生我們的分析表明,1500 次批量讀取中有 1 次反映部分業(yè)務(wù)性更新,這可能使開發(fā)人員體驗(yàn)變得復(fù)雜化,并產(chǎn)生意外的結(jié)果為了緩解這個問題,我們提出了 RAMP—TAO 協(xié)議,這是一個基于讀取原子級多分區(qū)協(xié)議的變體,支持最小開銷的部署,同時確保大規(guī)模讀取優(yōu)化工作負(fù)載的原子級可見性
免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),與本網(wǎng)無關(guān)。僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。
最新內(nèi)容
- 中國聯(lián)通:上半年凈利潤91.7億元,
- 1.這個AR特效像Snap和臉書會學(xué)習(xí)抖音
- 由香港創(chuàng)業(yè)與私募股權(quán)協(xié)會主辦的2021年第
- 當(dāng)3G網(wǎng)絡(luò)關(guān)閉后將為4G5G等新技術(shù)騰出空
- 成為國內(nèi)首個專為鴻蒙系統(tǒng)系統(tǒng)開發(fā)的省級政務(wù)
- 美蘭機(jī)場貨運(yùn)公司的一名搬運(yùn)工于8月5日被診
- 1-7月青海對“一帶一路”沿線國家合計進(jìn)出
- 廊坊銀保監(jiān)分局積極貫徹落實(shí)國務(wù)院和中國銀行
- 70%的草原仍處于不同程度的退化狀態(tài)
- LGA1700接口緊固件外形為矩形




