思思99在热线女精品视频,久久久无码人妻精品无码

大數(shù)據(jù)分析Python列表使用教程

時間：2020-05-27來源：lb577.com點擊量：次作者：Sissi

時間：2020-05-27點擊量：次作者：Sissi

　　列表是大數(shù)據(jù)分析Python中最強大的數(shù)據(jù)類型之一。在此大數(shù)據(jù)分析Python列表教程中，您將學習如何在分析有關移動應用程序的數(shù)據(jù)時使用列表。

　　在大數(shù)據(jù)分析Python列表使用教程中，我們假設您了解大數(shù)據(jù)分析Python的基本知識，包括使用字符串，整數(shù)和浮點數(shù)。如果您不熟悉這些內(nèi)容，則可以嘗試免費的大數(shù)據(jù)分析Python基礎知識課程。

　　我們將使用來自移動應用商店數(shù)據(jù)集(Ramanathan Perumal)的以下數(shù)據(jù)表：

大數(shù)據(jù)分析

　　表中的每個值都是一個數(shù)據(jù)點。例如，第一行(列標題之后)具有五個數(shù)據(jù)點：

　　1)Facebook

　　2)0.0

　　3)USD

　　4)2974676

　　5)3.5

　　數(shù)據(jù)點的集合構成一個數(shù)據(jù)集。我們可以將上面的整個表理解為數(shù)據(jù)點的集合，因此我們將整個表稱為數(shù)據(jù)集。我們可以看到我們的數(shù)據(jù)集有五行五列。

　　使用對大數(shù)據(jù)分析Python類型的理解，我們可能認為我們可以將每個數(shù)據(jù)點存儲在其自己的變量中-例如，這就是我們可以存儲第一行的數(shù)據(jù)點的方式：

大數(shù)據(jù)分析

　　上面，我們存儲了：

　　1)文字“ Facebook”作為字符串

　　2)價格為0.0的浮動

　　3)文本“ USD”作為字符串

　　4)評分計數(shù)2,974,676作為整數(shù)

　　5)用戶評級3.5為浮動

　　為數(shù)據(jù)集中的每個數(shù)據(jù)點創(chuàng)建變量將是一個繁瑣的過程。幸運的是，我們可以使用list更有效地存儲數(shù)據(jù)。這是我們可以為第一行創(chuàng)建數(shù)據(jù)點列表的方式：

大數(shù)據(jù)分析

　　要創(chuàng)建上面的列表，我們：

　　1)輸入一系列數(shù)據(jù)點，并用逗號分隔每個數(shù)據(jù)點： 'Facebook', 0.0, 'USD', 2974676, 3.5

　　2)用括號將序列括起來： ['Facebook', 0.0, 'USD', 2974676, 3.5]

　　創(chuàng)建列表后，通過將其分配給名為的變量，將其存儲在計算機的內(nèi)存中row_1。

　　要創(chuàng)建數(shù)據(jù)點列表，我們只需要：

　　1)用逗號分隔數(shù)據(jù)點。

　　2)用括號將數(shù)據(jù)點的序列括起來。

　　現(xiàn)在，我們創(chuàng)建五個列表，數(shù)據(jù)集中的每一行一個：

大數(shù)據(jù)分析

　　索引大數(shù)據(jù)分析Python列表

　　列表可以包含各種數(shù)據(jù)類型。類似的列表[4, 5, 6]具有相同的數(shù)據(jù)類型(僅整數(shù))，而列表['Facebook', 0.0, 'USD', 2974676, 3.5]具有混合的數(shù)據(jù)類型：

　　1)兩串('Facebook', 'USD')

　　2)兩個浮點(0.0，3.5)

　　3)一整數(shù)(2974676)

　　該['Facebook', 0.0, 'USD', 2974676, 3.5]列表有五個數(shù)據(jù)點。要查找列表的長度，我們可以使用以下len()命令：

大數(shù)據(jù)分析

　　對于小列表，我們只需在屏幕上計數(shù)數(shù)據(jù)點即可找到長度，但是len()當您使用包含許多元素的列表，或者需要為不知道長度的數(shù)據(jù)編寫代碼時，該命令將非常有用提前時間。

　　列表中的每個元素(數(shù)據(jù)點)都有一個與之關聯(lián)的特定編號，稱為索引編號。索引始終從0開始，因此第一個元素的索引號為0，第二個元素的索引號為1，依此類推。

大數(shù)據(jù)分析

　　若要快速找到列表元素的索引，請確定其在列表中的位置編號，然后減去1。例如，字符串'USD'是列表的第三個元素(位置編號3)，因此其索引編號必須為2，因為3 – 1 = 2。

　　索引號幫助我們從列表中檢索單個元素。回顧row_1上面的代碼示例中的列表，我們可以'Facebook'通過運行代碼來檢索索引編號為0 的第一個元素(字符串)row_1[0]。

大數(shù)據(jù)分析

　　檢索單個列表元素的語法遵循該模型list_name[index_number]。例如，上面的列表的名稱為row_1，第一個元素的索引號為0-在list_name[index_number]模型之后，我們得到row_1[0]，其中索引號0在變量name后面的方括號中row_1。

大數(shù)據(jù)分析

　　這是我們?nèi)绾螜z索中的每個元素row_1：

大數(shù)據(jù)分析

　　檢索列表元素使執(zhí)行操作更加容易。例如，我們可以選擇Facebook和Instagram的評分，并找到平均值或兩者之間的差異：

大數(shù)據(jù)分析

　　讓我們使用列表索引從前三行中提取評分數(shù)量，然后取平均值：

大數(shù)據(jù)分析

　　對列表使用負索引

　　在大數(shù)據(jù)分析Python中，我們有兩個列表索引系統(tǒng)：

　　1)正索引：_first)元素的索引號為0，第二個元素的索引號為1，依此類推。

　　2)負索引：最后一個元素的索引號為-1，倒數(shù)第二個元素的索引號為-2，依此類推。

大數(shù)據(jù)分析

　　實際上，我們幾乎總是使用正索引來檢索列表元素。當我們要選擇列表的最后一個元素時，負索引很有用-特別是如果列表很長，并且我們無法通過計數(shù)來判斷長度。

大數(shù)據(jù)分析

　　請注意，如果我們使用的索引號不在兩個索引系統(tǒng)的范圍內(nèi)，則會得到一個IndexError。

大數(shù)據(jù)分析

　　讓我們使用負索引從前三行中的每行中提取用戶評分(最后一個值)，然后取平均值。

大數(shù)據(jù)分析

　　切片大數(shù)據(jù)分析Python列表

　　代替單獨選擇列表元素，我們可以使用語法快捷方式來選擇兩個或更多連續(xù)元素：

大數(shù)據(jù)分析

　　當我們從一個名為list的列表中選擇第一個n元素(n代表一個數(shù)字)時a_list，可以使用語法快捷方式a_list[0:n]。在上面的示例中，我們需要從列表中選擇前三個元素row_3，因此我們使用row_3[0:3]。

　　當選擇前三個元素時，我們將列表的一部分切成薄片。因此，選擇列表的一部分的過程稱為列表切片。

　　我們可能想采用多種方式對列表進行切片：

大數(shù)據(jù)分析

　　要檢索我們想要的任何列表切片：

　　a)我們首先需要確定切片的第一個和最后一個元素。

　　b)然后，我們需要確定切片的第一個和最后一個元素的索引號。

　　c)最后，我們可以使用語法檢索所需的列表切片a_list[m:n]，其中：

　　　　1)m表示切片的第一個元素的索引號;和

　　　　2)n表示切片的最后一個元素的索引號加上一個(如果最后一個元素的索引號為2，則我們n將為3，如果最后一個元素的索引號為4，n則將為5，依此類推)。

大數(shù)據(jù)分析

　　當我們需要選擇第一個或最后一個x元素(x代表一個數(shù)字)時，我們可以使用更簡單的語法快捷方式：

　　1)a_list[:x]當我們要選擇第一個x元素時。

　　2)a_list[-x:]當我們要選擇最后一個x元素時。

大數(shù)據(jù)分析

　　讓我們看看如何從第一行中提取前四個元素(以及有關Facebook的數(shù)據(jù))：

大數(shù)據(jù)分析

　　以及第五行中的元素3和4(以及有關Pandora的數(shù)據(jù))：

大數(shù)據(jù)分析

　　大數(shù)據(jù)分析Python列表列表

　　之前，我們介紹了列表，它是每個數(shù)據(jù)點使用一個變量的更好選擇。'Facebook', 0.0, 'USD', 2974676, 3.5我們可以將五個數(shù)據(jù)點捆綁在一起，而不是為五個數(shù)據(jù)點分別設置一個變量，然后將列表存儲在一個變量中。

　　到目前為止，我們一直與具有五個行的數(shù)據(jù)集，我們已經(jīng)存儲在單獨的變量每行作為一個列表(變量row_1，row_2，row_3，row_4，和row_5)。但是，如果我們的數(shù)據(jù)集包含5,000行，那么最終將得到5,000個變量，這將使我們的代碼混亂，幾乎無法使用。

　　為了解決這個問題，我們可以將五個變量存儲在一個列表中：

大數(shù)據(jù)分析

　　正如我們所看到的，data_set是一個列表，記錄了其它五個列表(row_1，row_2，row_3，row_4，和row_5)。包含其他列表的列表稱為列表列表。

　　該data_set變量仍然是一個列表，這意味著我們可以檢索單個列表元素并使用我們學到的語法執(zhí)行列表切片。在下面，我們：

　　a.使用檢索第一個列表元素(row_1)data_set[0]。

　　b.使用檢索最后一個列表元素(row_5)data_set[-1]。

　　c.通過使用進行列表切片，檢索前兩個列表元素(row_1和row_2)data_set[:2]。

大數(shù)據(jù)分析

　　我們會經(jīng)常需要檢索這是一個列表的列表的一部分列表各個元素-例如，我們可能要檢索的值3.5從['Facebook', 0.0, 'USD', 2974676, 3.5]，這是一部分data_set名單列表。下面，我們3.5從data_set使用中學到的內(nèi)容中進行摘錄：

　　a.我們row_1使用進行檢索data_set[0]，并將結果分配給名為的變量fb_row。

　　b.我們打印fb_row，輸出['Facebook', 0.0, 'USD', 2974676, 3.5]。

　　c.我們檢索的最后一個元素fb_row使用fb_row[-1](因為fb_row是一個列表)，并將結果分配給指定的變量fb_rating。

　　d.打印fb_rating，輸出3.5

大數(shù)據(jù)分析

　　上面，我們3.5分兩步進行檢索：首先檢索data_set[0]，然后檢索fb_row[-1]。但是，3.5通過鏈接兩個索引([0]和[-1])，有一種更簡單的方法來檢索相同的值-代碼將data_set[0][-1]檢索3.5：

大數(shù)據(jù)分析

　　上面，我們已經(jīng)看到了兩種獲取值的方法3.5。兩種方法都導致相同的輸出(3.5)，但是第二種方法涉及較少的鍵入操作，因為它很好地結合了我們在第一種情況下看到的步驟。雖然您可以選擇任一選項，但人們通常會選擇第二個選項。

　　讓我們將五個單獨的列表轉換為列表列表：

大數(shù)據(jù)分析

　　重復清單程序

　　在執(zhí)行此任務之前，我們對計算應用程序的平均評分感興趣。當我們只處理三行時，這是一個可行的任務，但是添加的行越多，它變得越難。使用之前的策略，我們將：

　　a.檢索每個單獨的評分。

　　b.總結一下評分。

　　c.除以評分數(shù)。

大數(shù)據(jù)分析

　　如您所見，五個等級會使情況變得復雜。如果我們正在處理包含1,000行的數(shù)據(jù)，則將需要不切實際的代碼量!我們需要找到一種簡單的方法來檢索許多評級。

　　查看上面的代碼示例，我們看到一個過程不斷重復：我們?yōu)橹械拿總€列表選擇了最后一個列表元素app_data_set。該app_data_set賣場五名名單，所以我們重復相同的過程五次。如果我們可以直接告訴大數(shù)據(jù)分析Python我們要為其中的每個列表重復該過程app_data_set怎么辦?

　　幸運的是，我們可以做到這一點-大數(shù)據(jù)分析Python為我們提供了一種簡單的方法來重復一個過程，當我們需要重復數(shù)百，數(shù)千甚至數(shù)百萬次過程時，這可以極大地幫助我們。

　　比方說，我們有一個列表[3, 5, 1, 2]分配給一個變量ratings，我們想重復以下過程：對每個元素在 ratings，打印元素。這就是我們可以將其轉換為大數(shù)據(jù)分析Python語法的方式：

大數(shù)據(jù)分析

　　在我們上面的第一個例子，我們想重復這個過程是_”提取的最后一個元素為每個列表中的 app_data_set “_。這是我們可以將該過程轉換為大數(shù)據(jù)分析Python語法的方式：

大數(shù)據(jù)分析

　　讓我們嘗試更好地了解上述情況。大數(shù)據(jù)分析Python一次將一個列表元素從中分離出來app_data_set，然后將其分配給each_list(基本上成為一個存儲列表的變量-我們將在下一個屏幕上進一步討論)：

大數(shù)據(jù)分析

　　使用上述技術需要我們?yōu)閿?shù)據(jù)集中的每一行編寫一行代碼。但是使用該for each_list in app_data_set技術只需要我們寫兩行代碼，而不管數(shù)據(jù)集中的行數(shù)是多少—數(shù)據(jù)集可以有五行或一百萬。

　　我們的中間目標是使用這項新技術來計算上述五行的平均評分，而最終目標是計算包含7,197行的數(shù)據(jù)集的平均評分。我們將在此任務的接下來的幾個屏幕中執(zhí)行此操作，但現(xiàn)在，我們將集中精力練習此技術以更好地掌握它。

　　在編寫任何代碼之前，我們需要縮進我們要在右邊重復四個空格字符的代碼：

大數(shù)據(jù)分析

　　從技術上講，我們只需要在代碼的右邊至少縮進一個空格字符，但是大數(shù)據(jù)分析Python社區(qū)中的約定是使用四個空格字符。這有助于提高可讀性-遵循此約定的其他人將更容易閱讀您的代碼，并且您將更容易閱讀他們的代碼。

　　讓我們使用這種技術來打印每個應用程序的名稱和等級：

大數(shù)據(jù)分析

　　大數(shù)據(jù)分析Python中的列表和For循環(huán)

　　我們剛剛學到的技術稱為循環(huán)。循環(huán)是一個非常有用的工具，可用于使用大數(shù)據(jù)分析Python列表執(zhí)行重復過程。因為我們總是以for(像in for some_variable in some_list:)開始，所以這種技術被稱為for循環(huán)。

　　這些是for循環(huán)的結構部分

大數(shù)據(jù)分析

　　主體中的縮進代碼

　　a.對于第一次迭代，該值是iterable的第一個元素(來自上面的示例1)。

　　b.對于第二次迭代，該值是iterable的第二個元素(來自上面的示例3)。

　　c.對于第三次迭代，該值是iterable的第三個元素(來自上面的示例5)。

大數(shù)據(jù)分析

　　插入變量的名稱可以是您喜歡的任何名稱–如果value在上面dog的代碼中將替換為，則代碼將以完全相同的方式工作。也就是說，習慣上使用有助于傳達數(shù)據(jù)含義的東西。

　　循環(huán)主體之外的代碼可以與代碼交互

　　a.初始化變量 a_sum

　　b.我們循環(huán)(或迭代a_list

　　1)在迭代變量的當前值和存儲在其中的當前值之間執(zhí)行加法運算(在循環(huán)體內(nèi))valuea_suma_sum

　　2)將加法結果分配回 a_sum

　　3)打印a_sum變量的值(在循環(huán)體內(nèi))。請注意，a_sum每次添加后更改的值。在循環(huán)結束時，a_sum具有值9，該值等于a_list(1 + 3 + 5)中數(shù)字的總和。

大數(shù)據(jù)分析

　　上面，我們創(chuàng)建了一種匯總列表中數(shù)字的方法。我們可以使用這種技術總結數(shù)據(jù)集中的評分。一旦有了總和，我們只需要除以等級數(shù)即可得出平均值。

大數(shù)據(jù)分析

　　我們在這里介紹了for循環(huán)的基礎知識，但是如果您想進行更多練習，我們還提供了有關for循環(huán)基礎知識和高級for循環(huán)的教程，您可以檢閱。

　　計算列表平均值的另一種方法

　　現(xiàn)在，我們將學習計算平均評級值的另一種方法。創(chuàng)建列表后，可以使用命令向其中添加(或追加)值append()。

大數(shù)據(jù)分析

　　與我們學過的其他命令不同，請注意 append()list_name.append()append()

　　現(xiàn)在我們知道如何將值添加到列表中，我們可以按照以下步驟計算平均應用評分：

　　a.我們初始化一個空列表。

　　b.我們開始遍歷數(shù)據(jù)集并提取

　　c.我們追加

　　d.獲得所有等級后，我們：

　　1)使用該sum()命令匯總所有評分(以便能夠使用sum()

　　2)我們將總和除以評分數(shù)(可以使用len()命令獲得評分)。

　　在下面，我們可以看到為五行數(shù)據(jù)集實施的上述步驟：

大數(shù)據(jù)分析

　　我們還可以append()通過將數(shù)據(jù)追加為列表來將另一行添加到列表中。讓我們看看它是如何工作的：

大數(shù)據(jù)分析

　　現(xiàn)在，讓我們使用上面學到的技術來計算所有六個應用程序的平均評分：

大數(shù)據(jù)分析

　　下一步

　　在大數(shù)據(jù)分析Python列表使用教程中，我們學習了如何：

　　a.使用大數(shù)據(jù)分析Python列表存儲和處理數(shù)據(jù)

　　b.使用正索引和負索引訪問存儲在列表中的值

　　c.使用列表列表來處理表格數(shù)據(jù)

　　d.用于循環(huán)自動執(zhí)行重復性任務

　　e.將值附加到列表

　　如果您想練習使用大數(shù)據(jù)分析Python列表，那么大數(shù)據(jù)分析Python列表使用教程是基于我們的免費大數(shù)據(jù)分析Python基礎課程的一部分。該課程可以從您的Web瀏覽器上進行，您將編寫代碼來分析7,000多個移動應用程序的完整數(shù)據(jù)集!

預約申請免費試聽課

填寫下面表單即可預約申請免費試聽！怕錢不夠？可先就業(yè)掙錢后再付學費！怕學不會？助教全程陪讀，隨時解惑！擔心就業(yè)？一地學習，可推薦就業(yè)！

?2007-2022/ lb577.com 北京漫動者數(shù)字科技有限公司備案號：京ICP備12034770號監(jiān)督電話：010-53672995 郵箱：bjaaa@aaaedu.cc

AAA教育

大數(shù)據(jù)分析Python列表使用教程

預約申請免費試聽課

AAA教育官方微信

視頻學習群