包含水果和蔬菜的高品質圖像資料集。包括以下水果和蔬菜:蘋果(不同品種:深紅雪、金、金紅、澳洲青蘋果、粉紅佳人、紅、紅美味)、杏子、酪梨、熟酪梨、香蕉(黃色、紅色、手指餅乾) ,甜菜根紅, 藍莓, 仙人掌果, 哈密瓜(2 個品種), 楊桃, 花椰菜, 櫻桃(不同品種, 雷尼爾), 櫻桃蠟(黃, 紅, 黑), 栗, 小柑橘, 椰子, 玉米(帶殼), 黃瓜(成熟)、棗子、茄子、無花果、薑根、西番蓮、葡萄(藍色、粉紅色、白色(不同品種))、葡萄柚(粉紅色、白色)、番石榴、榛果、越橘、獼猴桃、柿子、大頭菜、金橘、檸檬(正常,邁耶),青檸,荔枝,柑橘,芒果(綠色,紅色),芒果,馬拉庫賈,甜瓜皮爾德薩波,桑葚,油桃(普通,平),堅果(森林,山核桃),洋蔥(紅色,白色) 、橙子、木瓜、百香果、桃子(不同品種)、Pepino、梨(不同品種、Abate、Forelle、Kaiser、Monster、Red、 Stone、Williams)、胡椒(紅、綠、橙、黃)、酸漿(普通) ,帶殼),鳳梨(普通,迷你),火龍果紅,李子(不同品種),石榴,柚子,馬鈴薯(紅,甜,白),木瓜,紅毛丹,覆盆子,紅醋栗,薩拉克,草莓(普通,楔形) )、番茄、橘子、番茄(不同品種、栗色、櫻桃紅、黃色、未成熟、心形)、核桃、西瓜。
圖片總數:90483。
訓練集大小:67692 張圖像(每張圖像一個水果或蔬菜)。
測試集大小:22688 張圖像(每張圖像一個水果或蔬菜)。
多水果集大小:103 張圖像(每張圖像超過一個水果(或水果類))
課時數:131(水果和蔬菜)。
圖片尺寸:100x100 像素。
檔案名稱格式:image_index_100.jpg(例如32_100.jpg)或r_image_index_100.jpg(例如r_32_100.jpg)或r2_image_index_100.jpg或r3_image_index_100.jpg。 “r”代表旋轉水果。 “r2”表示水果繞第三軸旋轉。 「100」來自影像尺寸(100x100 像素)。
同一水果(例如蘋果)的不同品種被儲存為屬於不同的類別。
文件夾培訓和測試包含用於培訓和測試目的的圖像。
資料夾 test-multiple_fruits 包含具有多個水果的圖像。其中一些被其他水果部分覆蓋。這是現實世界檢測的絕佳測試。
資料夾 src/image_classification 包含用於訓練神經網路的 python 程式碼。它使用 TensorFlow 2.0 庫。
資料夾 src/image_classification_tf_1.8.0 包含用於訓練神經網路的舊版本 python 程式碼。它使用 TensorFlow 1.8.0 庫。
資料夾 src/utils 包含用於從背景中提取水果或蔬菜的 C++ 程式碼。
資料夾論文包含與該資料集相關的研究論文。
該資料集也可以從以下位址下載:Kaggle
Horea Muresan,Mihai Oltean,使用深度學習從圖像中識別水果,Acta Univ。 Sapientiae,資訊學卷。 10,第 1 期,第 26-42 頁,2018 年。
將水果和蔬菜種植在低速馬達(3轉/分鐘)的軸中,並錄製20秒的短片。
使用羅技 C920 攝影機拍攝水果。這是最好的網路攝影機之一。
在水果後面我們放了一張白紙當背景。
然而,由於光照條件的變化,背景不均勻,我們編寫了專用演算法從背景中提取水果。該演算法屬於洪水填充類型:我們從圖像的每個邊緣開始,標記那裡的所有像素,然後標記在已標記像素的鄰域中找到的所有像素,其中顏色之間的距離小於規定值。我們重複上一步,直到沒有更多的像素可以被標記。
所有標記的像素都被視為背景(然後用白色填滿),其餘像素被視為屬於物件。
2 個相鄰像素之間的距離的最大值是演算法的一個參數,並為每部電影設定(透過反覆試驗)。
test-multiple_fruits 資料夾中的圖片是使用 Nexus 5X 手機製作的。
我們在這些數據上運行 TensorFlow,結果在本研究論文中介紹。
水果的拍攝日期如下(YYYY.MM.DD):
2017.02.25 - 蘋果(金色)。
2017.02.28 - 蘋果(紅黃1、紅、金2)、奇異果、梨子、葡萄柚、檸檬、柳橙、草莓。
2017.03.05 - 蘋果(golden3、Braeburn、Granny Smith、red2)。
2017.03.07 - 蘋果(red3)。
2017.05.10 - 李子、桃子、扁桃、杏子、油桃、石榴。
2017.05.27 - 酪梨、木瓜、葡萄、櫻桃。
2017.12.25 - 楊桃、仙人掌果、西番蓮、柿子、金橘、百香果、熟酪梨、木瓜。
2017.12.28 - 柑橘、可可、芒果、酸橙、荔枝。
2017.12.31 - 蘋果紅美味,梨怪,葡萄白。
2018.01.14 - 香蕉、葡萄柚粉、柑橘、鳳梨、橘柚。
2018.01.19 - 哈克貝利,覆盆子。
2018.01.26 - 棗子、Maracuja、Plum 2、Salak、Tamarillo。
2018.02.05 - 番石榴、葡萄白 2、檸檬梅爾
2018.02.07 - 香蕉紅、Pepino、火龍果紅。
2018.02.08 - 梨阿巴特,梨威廉斯。
2018.05.22 - 檸檬旋轉,石榴旋轉。
2018.05.24 - 櫻桃雷尼爾、櫻桃 2、草莓角。
2018.05.26 - 哈密瓜(2個品種)。
2018.05.31 - 薩波甜瓜。
2018.06.05 - 迷你鳳梨、酸漿、帶殼酸漿、紅毛丹。
2018.06.08 - 桑葚、紅醋栗。
2018.06.16 - 櫻桃紅、榛果、核桃、番茄。
2018.06.17 - 櫻桃蠟(黃色、紅色、黑色)。
2018.08.19 - 蘋果紅黃2,葡萄藍,葡萄白2,葡萄白3,桃子2,李子3,番茄栗色,番茄1-4。
2018.12.20 - 堅果山核桃、凱撒梨、番茄黃。
2018.12.21 - 香蕉手指餅,栗子,芒果斯坦。
2018.12.22 - 柚子甜心。
2019.04.21 - 蘋果紅雪、蘋果粉紅女士、藍莓、大頭菜、芒果紅、梨紅、胡椒(紅、黃、綠)。
2019.06.18 - 甜菜根紅、玉米、薑根、平油桃、堅果林、洋蔥紅、去皮洋蔥紅、洋蔥白、馬鈴薯紅、洗馬鈴薯紅、甜馬鈴薯、白馬鈴薯。
2019.07.07 - 花椰菜、茄子、梨子福萊爾、胡椒橙、番茄心。
2019.09.22 - 玉米皮、成熟的黃瓜、無花果、梨子2、梨核、未成熟的番茄、西瓜。
麻省理工學院許可證
版權所有 (c) 2017-2020 Mihai Oltean、Horea Muresan
特此免費授予任何獲得本軟體和相關文件文件(「軟體」)副本的人不受限制地使用本軟體,包括但不限於使用、複製、修改、合併的權利、發布、分發、再授權和/或銷售軟體的副本,並允許向其提供軟體的人員這樣做,但須滿足以下條件:
上述版權聲明和本授權聲明應包含在本軟體的所有副本或主要部分中。
本軟體以「現況」提供,不提供任何明示或暗示的保證,包括但不限於適銷性、特定用途的適用性和不侵權的保證。 IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE軟體.