旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實習/?A計劃
全國統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析Python列表使用教程

大數(shù)據(jù)分析Python列表使用教程

時間:2020-05-27來源:lb577.com點擊量:作者:Sissi
時間:2020-05-27點擊量:作者:Sissi



  列表是大數(shù)據(jù)分析Python中最強大的數(shù)據(jù)類型之一。在此大數(shù)據(jù)分析Python列表教程中,您將學習如何在分析有關移動應用程序的數(shù)據(jù)時使用列表。
 

  在大數(shù)據(jù)分析Python列表使用教程中,我們假設您了解大數(shù)據(jù)分析Python的基本知識,包括使用字符串,整數(shù)和浮點數(shù)。如果您不熟悉這些內(nèi)容,則可以嘗試免費的大數(shù)據(jù)分析Python基礎知識課程。
 

  我們將使用來自移動應用商店數(shù)據(jù)集(Ramanathan Perumal)的以下數(shù)據(jù)表:

大數(shù)據(jù)分析
 

  表中的每個值都是一個數(shù)據(jù)點。例如,第一行(列標題之后)具有五個數(shù)據(jù)點:
 

  1)Facebook

  2)0.0

  3)USD

  4)2974676

  5)3.5
 

  數(shù)據(jù)點的集合構成一個數(shù)據(jù)集。我們可以將上面的整個表理解為數(shù)據(jù)點的集合,因此我們將整個表稱為數(shù)據(jù)集。我們可以看到我們的數(shù)據(jù)集有五行五列。
 

  使用對大數(shù)據(jù)分析Python類型的理解,我們可能認為我們可以將每個數(shù)據(jù)點存儲在其自己的變量中-例如,這就是我們可以存儲第一行的數(shù)據(jù)點的方式:

大數(shù)據(jù)分析
 

  上面,我們存儲了:
 

  1)文字“ Facebook”作為字符串

  2)價格為0.0的浮動

  3)文本“ USD”作為字符串

  4)評分計數(shù)2,974,676作為整數(shù)

  5)用戶評級3.5為浮動
 

  為數(shù)據(jù)集中的每個數(shù)據(jù)點創(chuàng)建變量將是一個繁瑣的過程。幸運的是,我們可以使用list更有效地存儲數(shù)據(jù)。這是我們可以為第一行創(chuàng)建數(shù)據(jù)點列表的方式:

大數(shù)據(jù)分析
 

  要創(chuàng)建上面的列表,我們:
 

  1)輸入一系列數(shù)據(jù)點,并用逗號分隔每個數(shù)據(jù)點: 'Facebook', 0.0, 'USD', 2974676, 3.5

  2)用括號將序列括起來: ['Facebook', 0.0, 'USD', 2974676, 3.5]
 

  創(chuàng)建列表后,通過將其分配給名為的變量,將其存儲在計算機的內(nèi)存中row_1。
 

  要創(chuàng)建數(shù)據(jù)點列表,我們只需要:
 

  1)用逗號分隔數(shù)據(jù)點。

  2)用括號將數(shù)據(jù)點的序列括起來。
 

  現(xiàn)在,我們創(chuàng)建五個列表,數(shù)據(jù)集中的每一行一個:


大數(shù)據(jù)分析
 

  索引大數(shù)據(jù)分析Python列表
 

  列表可以包含各種數(shù)據(jù)類型。類似的列表[4, 5, 6]具有相同的數(shù)據(jù)類型(僅整數(shù)),而列表['Facebook', 0.0, 'USD', 2974676, 3.5]具有混合的數(shù)據(jù)類型:
 

  1)兩串('Facebook', 'USD')

  2)兩個浮點(0.0,3.5)

  3)一整數(shù)(2974676)
 

  該['Facebook', 0.0, 'USD', 2974676, 3.5]列表有五個數(shù)據(jù)點。要查找列表的長度,我們可以使用以下len()命令:


大數(shù)據(jù)分析
 

  對于小列表,我們只需在屏幕上計數(shù)數(shù)據(jù)點即可找到長度,但是len()當您使用包含許多元素的列表,或者需要為不知道長度的數(shù)據(jù)編寫代碼時,該命令將非常有用提前時間。
 

  列表中的每個元素(數(shù)據(jù)點)都有一個與之關聯(lián)的特定編號,稱為索引編號。索引始終從0開始,因此第一個元素的索引號為0,第二個元素的索引號為1,依此類推。
 


大數(shù)據(jù)分析
 

  若要快速找到列表元素的索引,請確定其在列表中的位置編號,然后減去1。例如,字符串'USD'是列表的第三個元素(位置編號3),因此其索引編號必須為2,因為3 – 1 = 2。
 

  索引號幫助我們從列表中檢索單個元素。回顧row_1上面的代碼示例中的列表,我們可以'Facebook'通過運行代碼來檢索索引編號為0 的第一個元素(字符串)row_1[0]。


大數(shù)據(jù)分析
 

  檢索單個列表元素的語法遵循該模型list_name[index_number]。例如,上面的列表的名稱為row_1,第一個元素的索引號為0-在list_name[index_number]模型之后,我們得到row_1[0],其中索引號0在變量name后面的方括號中row_1。


大數(shù)據(jù)分析
 

  這是我們?nèi)绾螜z索中的每個元素row_1:


大數(shù)據(jù)分析
 

  檢索列表元素使執(zhí)行操作更加容易。例如,我們可以選擇Facebook和Instagram的評分,并找到平均值或兩者之間的差異:


大數(shù)據(jù)分析
 

  讓我們使用列表索引從前三行中提取評分數(shù)量,然后取平均值:

大數(shù)據(jù)分析
 

  對列表使用負索引
 

  在大數(shù)據(jù)分析Python中,我們有兩個列表索引系統(tǒng):
 

  1)正索引:_first)元素的索引號為0,第二個元素的索引號為1,依此類推。

  2)負索引:最后一個元素的索引號為-1,倒數(shù)第二個元素的索引號為-2,依此類推。

大數(shù)據(jù)分析
 

  實際上,我們幾乎總是使用正索引來檢索列表元素。當我們要選擇列表的最后一個元素時,負索引很有用-特別是如果列表很長,并且我們無法通過計數(shù)來判斷長度。

大數(shù)據(jù)分析
 

  請注意,如果我們使用的索引號不在兩個索引系統(tǒng)的范圍內(nèi),則會得到一個IndexError。

大數(shù)據(jù)分析
 

  讓我們使用負索引從前三行中的每行中提取用戶評分(最后一個值),然后取平均值。
 

大數(shù)據(jù)分析

  切片大數(shù)據(jù)分析Python列表
 

  代替單獨選擇列表元素,我們可以使用語法快捷方式來選擇兩個或更多連續(xù)元素:

大數(shù)據(jù)分析
 

  當我們從一個名為list的列表中選擇第一個n元素(n代表一個數(shù)字)時a_list,可以使用語法快捷方式a_list[0:n]。在上面的示例中,我們需要從列表中選擇前三個元素row_3,因此我們使用row_3[0:3]。
 

  當選擇前三個元素時,我們將列表的一部分切成薄片。因此,選擇列表的一部分的過程稱為列表切片。
 

  我們可能想采用多種方式對列表進行切片:

大數(shù)據(jù)分析
 

  要檢索我們想要的任何列表切片:
 

  a)我們首先需要確定切片的第一個和最后一個元素。

  b)然后,我們需要確定切片的第一個和最后一個元素的索引號。

  c)最后,我們可以使用語法檢索所需的列表切片a_list[m:n],其中:

    1)m表示切片的第一個元素的索引號;和

    2)n表示切片的最后一個元素的索引號加上一個(如果最后一個元素的索引號為2,則我們n將為3,如果最后一個元素的索引號為4,n則將為5,依此類推)。

大數(shù)據(jù)分析
 

  當我們需要選擇第一個或最后一個x元素(x代表一個數(shù)字)時,我們可以使用更簡單的語法快捷方式:
 

  1)a_list[:x]當我們要選擇第一個x元素時。

  2)a_list[-x:]當我們要選擇最后一個x元素時。

大數(shù)據(jù)分析
 

  讓我們看看如何從第一行中提取前四個元素(以及有關Facebook的數(shù)據(jù)):

大數(shù)據(jù)分析
 

  以及第五行中的元素3和4(以及有關Pandora的數(shù)據(jù)):

大數(shù)據(jù)分析
 

  大數(shù)據(jù)分析Python列表列表
 

  之前,我們介紹了列表,它是每個數(shù)據(jù)點使用一個變量的更好選擇。'Facebook', 0.0, 'USD', 2974676, 3.5我們可以將五個數(shù)據(jù)點捆綁在一起,而不是為五個數(shù)據(jù)點分別設置一個變量,然后將列表存儲在一個變量中。
 

  到目前為止,我們一直與具有五個行的數(shù)據(jù)集,我們已經(jīng)存儲在單獨的變量每行作為一個列表(變量row_1,row_2,row_3,row_4,和row_5)。但是,如果我們的數(shù)據(jù)集包含5,000行,那么最終將得到5,000個變量,這將使我們的代碼混亂,幾乎無法使用。
 

  為了解決這個問題,我們可以將五個變量存儲在一個列表中:

大數(shù)據(jù)分析
 

  正如我們所看到的,data_set是一個列表,記錄了其它五個列表(row_1,row_2,row_3,row_4,和row_5)。包含其他列表的列表稱為列表列表。
 

  該data_set變量仍然是一個列表,這意味著我們可以檢索單個列表元素并使用我們學到的語法執(zhí)行列表切片。在下面,我們:
 

  a.使用檢索第一個列表元素(row_1)data_set[0]。

  b.使用檢索最后一個列表元素(row_5)data_set[-1]。

  c.通過使用進行列表切片, 檢索前兩個列表元素(row_1和row_2)data_set[:2]。

大數(shù)據(jù)分析
 

  我們會經(jīng)常需要檢索這是一個列表的列表的一部分列表各個元素-例如,我們可能要檢索的值3.5從['Facebook', 0.0, 'USD', 2974676, 3.5],這是一部分data_set名單列表。下面,我們3.5從data_set使用中學到的內(nèi)容中進行摘錄:
 

  a.我們row_1使用進行檢索data_set[0],并將結果分配給名為的變量fb_row。

  b.我們打印fb_row,輸出['Facebook', 0.0, 'USD', 2974676, 3.5]。

  c.我們檢索的最后一個元素fb_row使用fb_row[-1](因為fb_row是一個列表),并將結果分配給指定的變量fb_rating。

  d.打印fb_rating,輸出3.5

大數(shù)據(jù)分析
 

  上面,我們3.5分兩步進行檢索:首先檢索data_set[0],然后檢索fb_row[-1]。但是,3.5通過鏈接兩個索引([0]和[-1]),有一種更簡單的方法來檢索相同的值-代碼將data_set[0][-1]檢索3.5:

大數(shù)據(jù)分析


  上面,我們已經(jīng)看到了兩種獲取值的方法3.5。兩種方法都導致相同的輸出(3.5),但是第二種方法涉及較少的鍵入操作,因為它很好地結合了我們在第一種情況下看到的步驟。雖然您可以選擇任一選項,但人們通常會選擇第二個選項。
 

  讓我們將五個單獨的列表轉換為列表列表:

大數(shù)據(jù)分析
 

  重復清單程序
 

  在執(zhí)行此任務之前,我們對計算應用程序的平均評分感興趣。當我們只處理三行時,這是一個可行的任務,但是添加的行越多,它變得越難。使用之前的策略,我們將:
 

  a.檢索每個單獨的評分。

  b.總結一下評分。

  c.除以評分數(shù)。

大數(shù)據(jù)分析
 

  如您所見,五個等級會使情況變得復雜。如果我們正在處理包含1,000行的數(shù)據(jù),則將需要不切實際的代碼量!我們需要找到一種簡單的方法來檢索許多評級。
 

  查看上面的代碼示例,我們看到一個過程不斷重復:我們?yōu)橹械拿總€列表選擇了最后一個列表元素app_data_set。該app_data_set賣場五名名單,所以我們重復相同的過程五次。如果我們可以直接告訴大數(shù)據(jù)分析Python我們要為其中的每個列表重復該過程app_data_set怎么辦?
 

  幸運的是,我們可以做到這一點-大數(shù)據(jù)分析Python為我們提供了一種簡單的方法來重復一個過程,當我們需要重復數(shù)百,數(shù)千甚至數(shù)百萬次過程時,這可以極大地幫助我們。
 

  比方說,我們有一個列表[3, 5, 1, 2]分配給一個變量ratings,我們想重復以下過程:對每個元素在 ratings,打印元素。這就是我們可以將其轉換為大數(shù)據(jù)分析Python語法的方式:

大數(shù)據(jù)分析
 

  在我們上面的第一個例子,我們想重復這個過程是_”提取的最后一個元素為每個列表中的 app_data_set “_。這是我們可以將該過程轉換為大數(shù)據(jù)分析Python語法的方式:

大數(shù)據(jù)分析
 

  讓我們嘗試更好地了解上述情況。大數(shù)據(jù)分析Python一次將一個列表元素從中分離出來app_data_set,然后將其分配給each_list(基本上成為一個存儲列表的變量-我們將在下一個屏幕上進一步討論):

大數(shù)據(jù)分析
 

  使用上述技術需要我們?yōu)閿?shù)據(jù)集中的每一行編寫一行代碼。但是使用該for each_list in app_data_set技術只需要我們寫兩行代碼,而不管數(shù)據(jù)集中的行數(shù)是多少—數(shù)據(jù)集可以有五行或一百萬。
 

  我們的中間目標是使用這項新技術來計算上述五行的平均評分,而最終目標是計算包含7,197行的數(shù)據(jù)集的平均評分。我們將在此任務的接下來的幾個屏幕中執(zhí)行此操作,但現(xiàn)在,我們將集中精力練習此技術以更好地掌握它。
 

  在編寫任何代碼之前,我們需要縮進我們要在右邊重復四個空格字符的代碼:

大數(shù)據(jù)分析
 

  從技術上講,我們只需要在代碼的右邊至少縮進一個空格字符,但是大數(shù)據(jù)分析Python社區(qū)中的約定是使用四個空格字符。這有助于提高可讀性-遵循此約定的其他人將更容易閱讀您的代碼,并且您將更容易閱讀他們的代碼。
 

  讓我們使用這種技術來打印每個應用程序的名稱和等級:

大數(shù)據(jù)分析
 

  大數(shù)據(jù)分析Python中的列表和For循環(huán)
 

  我們剛剛學到的技術稱為循環(huán)。循環(huán)是一個非常有用的工具,可用于使用大數(shù)據(jù)分析Python列表執(zhí)行重復過程。因為我們總是以for(像in for some_variable in some_list:)開始,所以這種技術被稱為for循環(huán)。
 

  這些是for循環(huán)的結構部分
 

大數(shù)據(jù)分析
 

  主體中 的縮進代碼
 

  a.對于第一次迭代,該值是iterable的第一個元素(來自上面的示例1)。

  b.對于第二次迭代,該值是iterable的第二個元素(來自上面的示例3)。

  c.對于第三次迭代,該值是iterable的第三個元素(來自上面的示例5)。

大數(shù)據(jù)分析
 

  插入變量的名稱可以是您喜歡的任何名稱–如果value在上面dog的代碼中將替換為,則代碼將以完全相同的方式工作。也就是說,習慣上使用有助于傳達數(shù)據(jù)含義的東西。
 

  循環(huán)主體之外的 代碼可以與代碼交互
 

  a.初始化變量 a_sum

  b.我們循環(huán)(或迭代a_list

  1)在迭代變量的當前值和存儲在其中的當前值之間執(zhí)行加法運算(在循環(huán)體內(nèi))valuea_suma_sum

  2)將加法結果分配回 a_sum

  3)打印a_sum變量的值(在循環(huán)體內(nèi))。請注意,a_sum每次添加后更改的值。在循環(huán)結束時,a_sum具有值9,該值等于a_list(1 + 3 + 5)中數(shù)字的總和。

大數(shù)據(jù)分析
 

  上面,我們創(chuàng)建了一種匯總列表中數(shù)字的方法。我們可以使用這種技術總結數(shù)據(jù)集中的評分。一旦有了總和,我們只需要除以等級數(shù)即可得出平均值。

大數(shù)據(jù)分析
 

  我們在這里介紹了for循環(huán)的基礎知識,但是如果您想進行更多練習,我們還提供了有關for循環(huán)基礎知識和高級for循環(huán)的教程,您可以檢閱。
 

  計算列表平均值的另一種方法
 

  現(xiàn)在,我們將學習計算平均評級值的另一種方法。創(chuàng)建列表后,可以使用命令向其中添加(或追加)值append()。

大數(shù)據(jù)分析
 

  與我們學過的其他命令不同,請注意 append()list_name.append()append()
 

  現(xiàn)在我們知道如何將值添加到列表中,我們可以按照以下步驟計算平均應用評分:
 

  a.我們初始化一個空列表。

  b.我們開始遍歷數(shù)據(jù)集并提取

  c.我們追加

  d.獲得所有等級后,我們:

  1)使用該sum()命令匯總所有評分(以便能夠使用sum()

  2)我們將總和除以評分數(shù)(可以使用len()命令獲得評分)。
 

  在下面,我們可以看到為五行數(shù)據(jù)集實施的上述步驟:

大數(shù)據(jù)分析
 

  我們還可以append()通過將數(shù)據(jù)追加為列表來將另一行添加到列表中。讓我們看看它是如何工作的:

大數(shù)據(jù)分析
 

  現(xiàn)在,讓我們使用上面學到的技術來計算所有六個應用程序的平均評分:

大數(shù)據(jù)分析
 

  下一步
 

  在大數(shù)據(jù)分析Python列表使用教程中,我們學習了如何:
 

  a.使用大數(shù)據(jù)分析Python列表存儲和處理數(shù)據(jù)

  b.使用正索引和負索引訪問存儲在列表中的值

  c.使用列表列表來處理表格數(shù)據(jù)

  d.用于循環(huán)自動執(zhí)行重復性任務

  e.將值附加到列表
 

  如果您想練習使用大數(shù)據(jù)分析Python列表,那么大數(shù)據(jù)分析Python列表使用教程是基于我們的免費大數(shù)據(jù)分析Python基礎課程的一部分。該課程可以從您的Web瀏覽器上進行,您將編寫代碼來分析7,000多個移動應用程序的完整數(shù)據(jù)集!

 

預約申請免費試聽課

填寫下面表單即可預約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學習,可推薦就業(yè)!

?2007-2021/北京漫動者教育科技有限公司版權所有
備案號:京ICP備12034770號

?2007-2022/ lb577.com 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號

網(wǎng)站地圖