首頁(yè) » 基礎(chǔ)知識(shí) » 視覺(jué)slam(學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí))

視覺(jué)slam(學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí))

分類：基礎(chǔ)知識(shí) 日期：2022-02-23 22:56 瀏覽：12 次

1.學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí)

開始做SLAM（機(jī)器人同時(shí)定位與建圖）研究已經(jīng)近一年了。從一年級(jí)開始對(duì)這個(gè)方向產(chǎn)生興趣，到現(xiàn)在為止，也算是對(duì)這個(gè)領(lǐng)域有了大致的了解。然而越了解，越覺(jué)得這個(gè)方向難度很大?？傮w來(lái)講有以下幾個(gè)原因：

入門資料很少。雖然國(guó)內(nèi)也有不少人在做，但這方面現(xiàn)在沒(méi)有太好的入門教程?！禨LAM for dummies》可以算是一篇。中文資料幾乎沒(méi)有。

SLAM研究已進(jìn)行了三十多年，從上世紀(jì)的九十年代開始。其中又有若干歷史分枝和爭(zhēng)論，要把握它的走向就很費(fèi)工夫。

難以實(shí)現(xiàn)。SLAM是一個(gè)完整的系統(tǒng)，由許多個(gè)分支模塊組成?，F(xiàn)在經(jīng)典的方案是“圖像前端，優(yōu)化后端，閉環(huán)檢測(cè)”的三部曲，很多文獻(xiàn)看完了自己實(shí)現(xiàn)不出來(lái)。

自己動(dòng)手編程需要學(xué)習(xí)大量的先決知識(shí)。首先你要會(huì)C和C++，網(wǎng)上很多代碼還用了11標(biāo)準(zhǔn)的C++。第二要會(huì)用Linux。第三要會(huì)cmake,vim/emacs及一些編程工具。第四要會(huì)用openCV, PCL, Eigen等第三方庫(kù)。只有學(xué)會(huì)了這些東西之后，你才能真正上手編一個(gè)SLAM系統(tǒng)。如果你要跑實(shí)際機(jī)器人，還要會(huì)ROS。

當(dāng)然，困難多意味著收獲也多，坎坷的道路才能鍛煉人（比如說(shuō)走著走著才發(fā)現(xiàn)Linux和C++才是我的真愛(ài)之類的。）鑒于目前網(wǎng)上關(guān)于視覺(jué)SLAM的資料極少，我于是想把自己這一年多的經(jīng)驗(yàn)與大家分享一下。說(shuō)的不對(duì)的地方請(qǐng)大家批評(píng)指正。

這篇文章關(guān)注視覺(jué)SLAM，專指用攝像機(jī)，Kinect等深度像機(jī)來(lái)做導(dǎo)航和探索，且主要關(guān)心室內(nèi)部分。到目前為止，室內(nèi)的視覺(jué)SLAM仍處于研究階段，遠(yuǎn)未到實(shí)際應(yīng)用的程度。一方面，編寫和使用視覺(jué)SLAM需要大量的專業(yè)知識(shí)，算法的實(shí)時(shí)性未達(dá)到實(shí)用要求；另一方面，視覺(jué)SLAM生成的地圖（多數(shù)是點(diǎn)云）還不能用來(lái)做機(jī)器人的路徑規(guī)劃，需要科研人員進(jìn)一步的探索和研究。以下，我會(huì)介紹SLAM的歷史、理論以及實(shí)現(xiàn)的方式，且主要介紹視覺(jué)（Kinect）的實(shí)現(xiàn)方式。

2.視覺(jué)slam研究需要哪些硬件設(shè)備

其實(shí)還是要根據(jù)實(shí)際應(yīng)用需求去配置硬件。

像無(wú)人駕駛車輛或飛行器的自主飛行，需要的硬件設(shè)備就比較多了，主要是嵌入式計(jì)算機(jī)+攝像機(jī)+IMU，根據(jù)應(yīng)用領(lǐng)域、飛行器的尺寸、整體系統(tǒng)的功耗等等，合理的配置計(jì)算機(jī)、攝像機(jī)和設(shè)計(jì)VSLAM系統(tǒng)，最近小覓智能新出的小覓魔方是基于Nvidia Jetson TX2打造的嵌入式運(yùn)算平臺(tái)，具備1.5T Flops的運(yùn)算能力，還集成了視覺(jué)SLAM、人體識(shí)別和物體識(shí)別的開源算法，可以裝在例如攝像頭、無(wú)人機(jī)、機(jī)器人這種終端設(shè)備上，他們家本身也有小覓雙目攝像頭這一類產(chǎn)品，帶IMU的。

3.基于激光雷達(dá)的slam和基于視覺(jué)的slam有什么優(yōu)勢(shì)

激光雷達(dá)：

1.解析度高，測(cè)距精度高

2.抗有源干擾能力強(qiáng)

3.探測(cè)性能好

4.不受光線影響

5.測(cè)速范圍大

視覺(jué)（主要是攝像頭）：

成本低廉，用攝像頭做算法開發(fā)的人員也比較多，技術(shù)相對(duì)比較成熟。攝像頭的劣勢(shì)，第一，獲取準(zhǔn)確三維信息非常難（單目攝像頭幾乎不可能，也有人提出雙目或三目攝像頭去做）；另一個(gè)缺點(diǎn)是受環(huán)境光限制比較大。

4.學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí)

首先搬出寶典：Multiple View Geometry in Computer Vision。

這本書基本涵蓋了Vision-based SLAM這個(gè)領(lǐng)域的全部理論基礎(chǔ)！讀多少遍都不算多！另外建議配合Berkeley的課件學(xué)習(xí)。（更新：這本書書后附錄也可以一并讀完，包括附帶bundle adjustment最基本的levenberg marquardt方法，newton方法等）只要是SLAM問(wèn)題就要涉及optimization，就要用到各種least square算法。

所以另一個(gè)基礎(chǔ)理論是Sparse Matrix，這是大型稀疏矩陣處理的一般辦法?？梢詤⒖糄r. Tim Davis的課件：Tim Davis ，他的主頁(yè)里有全部的課程視頻和Project。

針對(duì)SLAM問(wèn)題，最常用的least square算法是Sparse Levenberg Marquardt algorithm，這里有一份開源的代碼以及具體實(shí)現(xiàn)的paper:Sparse Non-Linear Least Squares in C/C++ 然后是框架級(jí)的工具。最常用的機(jī)器人框架是ROSROS.org | Powering the world's robots，可以使用在Windows,Linux和MacOS等操作系統(tǒng)上，里面包含一整套常用的機(jī)器人理論的算法和工具的實(shí)現(xiàn)。

另一個(gè)開源工具集是OpenSLAM OpenSLAM.org，其中的g2o是目前最流行的graph optimization的實(shí)現(xiàn)工具。另外OpenCV也是視覺(jué)相關(guān)必備的基礎(chǔ)工具，Multiple View教材中的常用算法在OpenCV中都有常用的實(shí)現(xiàn)。

（更新：OpenCV的文檔Camera Calibration and 3D Reconstruction 中，包含SLAM相關(guān)的基礎(chǔ)理論公式以及C/C++/Python實(shí)現(xiàn)的API）另外多說(shuō)一句題外話，因?yàn)镺ptimization和圖片的feature extraction是SLAM里最核心的兩個(gè)問(wèn)題，而這兩個(gè)問(wèn)題都是運(yùn)算量極大的。好的SLAM框架要兼顧速度和精確度。

目前大部分Vision或者RGBD的SLAM框架都是用C++來(lái)時(shí)實(shí)現(xiàn)完成的以確保運(yùn)算速度。雖然我個(gè)人很欣賞Python，并且Python3也支持SciPy,OpenCV,ROS等重要工具，不過(guò)依然有大量的諸如g2o等基礎(chǔ)性庫(kù)在python下無(wú)法使用，而且如果要借鑒其他人的代碼，最方便的還是在C++中實(shí)現(xiàn)。

所以如果提問(wèn)者有志于在這個(gè)領(lǐng)域做深入研究，夯實(shí)的C++基礎(chǔ)是必不可少的。Introduction to Algorithms，以及 @vczh 推薦的C++ Primer等，都是在實(shí)際工作前要自己做好的功課。

下面說(shuō)一些硬件和實(shí)驗(yàn)上的知識(shí)儲(chǔ)備。首先Vision-based SLAM常用攝像機(jī)標(biāo)定（Camera Calibration）的世界通用簡(jiǎn)單方法，是張正友博士（Dr. Zhengyou Zhang，主頁(yè)Zhengyou Zhang's Home Page）的方法（張正友博士是本領(lǐng)域里少數(shù)的具有極其巨大影響力和貢獻(xiàn)的華人學(xué)者，已成腦殘粉嚶嚶嚶）。

具體方法和實(shí)現(xiàn)，我在這里推薦兩個(gè)，一個(gè)是Caltech工具箱：Camera Calibration Toolbox for Matlab ，以及相關(guān)paper:Camera Calibration Toolbox for Matlab。該方法的另一個(gè)實(shí)現(xiàn)，是Matlab最新版本內(nèi)置的Camera Calibration的application，自動(dòng)導(dǎo)入標(biāo)定圖片并把得到的結(jié)果輸出給Matlab，更加自動(dòng)化，更加便捷準(zhǔn)確。

更多的Camera Model理論知識(shí)請(qǐng)參考Multiple View Geometry。至于RGB-D Camera，最常用的采集設(shè)備有兩種，一種是Microsoft Kinect，一個(gè)生態(tài)環(huán)境完備的RGBD Camera，可以直接用Visual Studio可Kinect SDK直接開發(fā)，也有大量開發(fā)好的程序以供借鑒參考，也可以用OpenNI和ROS采集處理，我就不多介紹了，畢竟微軟是對(duì)程序員最友好的公司沒(méi)有之一（微軟大法好）。

另一個(gè)是Google的Project Tango,Google對(duì)于這個(gè)自家的神器還是很低調(diào)的，可以看看宣傳片ATAP Project Tango ，絕對(duì)酷炫——可惜我們lab剛剛買的那一臺(tái)，我還沒(méi)有用過(guò)，所以對(duì)具體開發(fā)不太了解。另外有幾個(gè)網(wǎng)上成熟的數(shù)據(jù)集和測(cè)試方法，一個(gè)是Malaga Dataset，一個(gè)西班牙的團(tuán)隊(duì)采集的Malaga城市數(shù)據(jù)：The Málaga Stereo and Laser Urban Data Set，覆蓋了城市中汽車駕駛的各種情況（停車，加速，減速，行人，建筑，綠化帶等），里面提供了雙攝像頭，Laser,IMU等數(shù)據(jù)以及GPS的ground truth trajectory。

不過(guò)該版本因?yàn)槭窃谑兄行?，所以GPS的ground truth并不可靠。另一個(gè)是慕尼黑工業(yè)大學(xué)Computer Vision Lab的RGB-D dataset https://vision.in.tum.de/data/datasets/rgbd-dataset，里面提供了大量的室內(nèi)的RGBD數(shù)據(jù)集，以及非常方便好用的benchmark tools。

第三個(gè)是KITTI Dataset:The KITTI Vision Benchmark Suite，也是認(rèn)可度很廣泛的汽車駕駛數(shù)據(jù)集。

5.學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí)

首先搬出寶典：Multiple View Geometry in Computer Vision。

不過(guò)該版本因?yàn)槭窃谑兄行模訥PS的ground truth并不可靠。另一個(gè)是慕尼黑工業(yè)大學(xué)Computer Vision Lab的RGB-D dataset https://vision.in.tum.de/data/datasets/rgbd-dataset，里面提供了大量的室內(nèi)的RGBD數(shù)據(jù)集，以及非常方便好用的benchmark tools。

第三個(gè)是KITTI Dataset:The KITTI Vision Benchmark Suite，也是認(rèn)可度很廣泛的汽車駕駛數(shù)據(jù)集。

6.如何通過(guò)視覺(jué)SLAM構(gòu)建得到的三維地圖進(jìn)行機(jī)器人的路徑規(guī)劃

機(jī)器人的最優(yōu)路徑規(guī)劃問(wèn)題就是依據(jù)某個(gè)或某些優(yōu)化準(zhǔn)則（工作代價(jià)最小、行走時(shí)間最短、行走路線最短等），在機(jī)器人的工作空間中尋找一條從起始位置到目標(biāo)位置的無(wú)碰撞路徑。

就如人一樣，只有知道怎么在環(huán)境中行走，才不會(huì)與其他物體相碰撞并且正確地從起始地到達(dá)目的地，才能去做其他的事。但是即使是完成這樣一個(gè)在我們看來(lái)十分簡(jiǎn)單的任務(wù)，其實(shí)也是經(jīng)過(guò)了一個(gè)良好配合與正確分析的過(guò)程。

首先眼睛要搜集環(huán)境信息，把看到的環(huán)境狀態(tài)反饋給大腦，然后大腦根據(jù)眼睛反饋回來(lái)的環(huán)境信息和所要到達(dá)的目的地做出綜合的分析，得到一個(gè)判斷和結(jié)果，然后指揮人的身體移動(dòng)，從而實(shí)現(xiàn)在環(huán) 境中的行走。機(jī)器人也是類似，只不過(guò)在這里傳感器充當(dāng) 了機(jī)器人的“眼睛”而路徑規(guī)劃模塊就相當(dāng)于機(jī)器人的“大，腦” ，根據(jù)傳感器信息和任務(wù)要求進(jìn)行分析和決策，指揮機(jī) 器人的運(yùn)動(dòng)。

視覺(jué)slam基礎(chǔ)知識(shí)

上一篇：名人傳的(《名人傳》有關(guān)知識(shí)) 下一篇：寫出關(guān)于草的詩(shī)句古詩(shī)(寫出含有草的古詩(shī))

潮流時(shí)尚	寫作素材	創(chuàng)新創(chuàng)業(yè)
生活常識(shí)	策劃方案	安全知識(shí)
自考專業(yè)	家居生活	三農(nóng)創(chuàng)業(yè)
勵(lì)志故事	時(shí)尚穿搭	星座知識(shí)

欧美一区二区二区,日韩欧美一区二区在线,国产91成人精品亚洲精品,国产日韩精品一区二区,一区二区三区在线观看免费,亚洲一区中文,亚洲二区在线

視覺(jué)slam(學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí))

1.學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí)

2.視覺(jué)slam研究需要哪些硬件設(shè)備

3.基于激光雷達(dá)的slam和基于視覺(jué)的slam有什么優(yōu)勢(shì)

4.學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí)

5.學(xué)習(xí)SLAM需要哪些預(yù)備知識(shí)

6.如何通過(guò)視覺(jué)SLAM構(gòu)建得到的三維地圖進(jìn)行機(jī)器人的路徑規(guī)劃

相關(guān)推薦

2014初級(jí)藥劑師真題(初級(jí)藥師考試內(nèi)容及其題型都有哪些)

知識(shí)產(chǎn)權(quán)法律基礎(chǔ)自測(cè)答案(求《法律基礎(chǔ)》模擬題和答案)

醫(yī)學(xué)類考題及答案(醫(yī)學(xué)試題庫(kù))

公共分什么類別(公共都包括哪些)

一級(jí)下冊(cè)第八單元?dú)w類(人教版小學(xué)語(yǔ)文一年級(jí)下冊(cè)第一~八單元教材分析及教學(xué)建議)

鋼結(jié)構(gòu)工程相關(guān)(鋼結(jié)構(gòu)有哪些點(diǎn))

dhlfedex的(請(qǐng)問(wèn)：DHL.EMS.UPS.TNT.FEDEX.各有什么不同及)

衡器考試題(求電子秤原理及)

招警公共考什么(公安系統(tǒng)公務(wù)員考試公共主要考哪些)

證券資格證金融(證券資格考試匯總是什么)