-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathtest_gaby.py
executable file
·117 lines (92 loc) · 2.45 KB
/
test_gaby.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
#!/usr/bin/env python
import numpy as np
import pandas as pd
import sys
if len(sys.argv) < 2:
fichierAOuvir = 'Data/temp.dat'
else :
fichierAOuvir = sys.argv[1]
print('Ouverture du fichier : ',fichierAOuvir)
try:
# Ouverture du fichier
f = open(fichierAOuvir, 'r')
# là ça fait une liste de liste
l = [ list(line.strip('\n').split('::')) for line in f ]
except Exception as e:
print("le problème vient du fichier : ",fichierAOuvir)
raise e
else:
print("Réussi")
def print_list(liste):
for i in liste:
print(i)
def print_list_of_list(liste):
for i in liste:
print_list(i)
def liste_TO_dataFrame(liste):
UserID = list()
MovieID = list()
Rating = list()
Timestamp = list()
for i in liste:
# i est une liste
UserID.append(i[0])
MovieID.append(i[1])
Rating.append(i[2])
Timestamp.append(i[3])
d = {
'UserID': pd.Series(UserID),
'MovieID': pd.Series(MovieID),
'Rating' : pd.Series(Rating),
'Timestamp' : pd.Series(Timestamp)
}
df = pd.DataFrame(d)
return df
def liste_TO_dataFrame2(liste,columms):
assert len(columms) == len(liste[0])
colList = [ [] for _ in columms]
for i in liste:
for j in range(0,len(columms)):
colList[j].append(i[j])
d = {}
for i in range(0,len(colList)):
d[columms[i]] = pd.Series(colList[i])
df = pd.DataFrame(d)
return df
######################################
###### Pour les ratings (test )
col = ['UserID','MovieID','Rating','Timestamp']
if fichierAOuvir == "Data/test_gaby.dat":
dfRatingsTest = liste_TO_dataFrame2(l,col)
print(dfRatingsTest)
else:
print_list_of_list(l)
#######################################
#### Pour les movies (test)
fichierAOuvir = 'Data/temp.dat'
try:
# Ouverture du fichier
f = open(fichierAOuvir, 'r')
# là ça fait une liste de liste
l = [ list(line.strip('\n').split('::')) for line in f ]
except Exception as e:
print("le problème vient du fichier : ",fichierAOuvir)
raise e
col = ['MovieID','Title','Genres']
dfMoviesTest = liste_TO_dataFrame2(l,col)
print(dfMoviesTest)
####################################
#### Pour les users ####
fichierAOuvir = 'Data/users.dat'
try:
# Ouverture du fichier
f = open(fichierAOuvir, 'r')
# là ça fait une liste de liste
l = [ list(line.strip('\n').split('::')) for line in f ]
except Exception as e:
print("le problème vient du fichier : ",fichierAOuvir)
raise e
col = ['UserID','Gender','Age','Occupation','Zip-code']
dfUser = liste_TO_dataFrame2(l,col)
print(dfUser)
#######################################