Updating sizing.py script to work with kubernetes 1.18 and store data in .csv format Change-Id: I03f99e2f5ab13cf25a51fe506af2665c369343bb

commit: 984cf7bc367e106c46ea6d82853129813cd027d1 [log] [tgz]
author: Matteo Scandolo <matteo.scandolo@gmail.com> Wed Jul 29 13:54:20 2020 -0700
committer: Matteo Scandolo <matteo.scandolo@gmail.com> Wed Jul 29 13:57:42 2020 -0700
tree: 5d2f09de60c238324761538178093809e16149a6
parent: 44219d088d30f415794a104e084b702220234cf9 [diff]
diff --git a/requirements.txt b/requirements.txt
index 1744c4f..11eb791 100644
--- a/requirements.txt
+++ b/requirements.txt

@@ -12,3 +12,4 @@
 cord-robot==2.1.1
 virtualenv
 matplotlib==3.0.3
+requests==2.24.0

diff --git a/tests/scale/sizing.py b/tests/scale/sizing.py
index 389bb1c..7a7893d 100644
--- a/tests/scale/sizing.py
+++ b/tests/scale/sizing.py

@@ -17,6 +17,13 @@
 # NOTE
 # Collecting the info for all containers in the same chart can be confusing,
 # we may want to create subcharts for the different groups, eg: infra, ONOS, core, adapters
+import csv
+from sys import platform as sys_pf
+
+if sys_pf == 'darwin':
+    import matplotlib
+
+    matplotlib.use("TkAgg")
 
 import argparse
 import requests
@@ -28,7 +35,7 @@
 EXCLUDED_POD_NAMES = [
     "kube", "coredns", "kind", "grafana",
     "prometheus", "tiller", "control-plane",
-    "calico", "nginx", "registry"
+    "calico", "nginx", "registry", "local-path"
 ]
 
 DATE_FORMATTER_FN = mdates.DateFormatter('%Y-%m-%d %H:%M:%S')
@@ -56,18 +63,35 @@
     r = requests.get("http://%s/api/v1/query_range" % address, cpu_params)
     print("Downloading CPU info from: %s" % r.url)
     container_cpu = r.json()["data"]["result"]
-    plot_cpu_consumption(remove_unwanted_containers(container_cpu),
-                         output="%s/cpu.pdf" % out_folder)
+    containers = remove_unwanted_containers(container_cpu)
+    plot_cpu_consumption(containers, output="%s/cpu.pdf" % out_folder)
+    data_to_csv(containers, output="%s/cpu.csv" % out_folder)
 
     r = requests.get("http://%s/api/v1/query" % address, {"query": container_mem_query})
     print("Downloading Memory info from: %s" % r.url)
     container_mem = r.json()["data"]["result"]
-    plot_memory_consumption(remove_unwanted_containers(container_mem),
-                            output="%s/memory.pdf" % out_folder)
+    containers = remove_unwanted_containers(container_mem)
+    plot_memory_consumption(containers, output="%s/memory.pdf" % out_folder)
+    data_to_csv(containers, output="%s/memory.csv" % out_folder)
+
+
+def data_to_csv(containers, output=None):
+    csv_file = open(output, "w+")
+    csv_writer = csv.writer(csv_file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
+
+    # we assume all the containers have the same timestamps
+    dates = [datetime.fromtimestamp(x[0]) for x in containers[0]["values"]]
+    csv_writer.writerow([''] + dates)
+
+    for c in containers:
+        name = c["metric"]["pod"]
+        data = c["values"]
+
+        values = [float(x[1]) for x in data]
+        csv_writer.writerow([name] + values)
 
 
 def plot_cpu_consumption(containers, output=None):
-
     plt.figure('cpu')
     fig, ax = plt.subplots()
     ax.xaxis.set_major_formatter(DATE_FORMATTER_FN)
@@ -79,7 +103,7 @@
     plt.ylabel("% used")
 
     for c in containers:
-        name = c["metric"]["pod_name"]
+        name = c["metric"]["pod"]
         data = c["values"]
 
         dates = [datetime.fromtimestamp(x[0]) for x in data]
@@ -108,7 +132,7 @@
     plt.ylabel("MB")
 
     for c in containers:
-        name = c["metric"]["pod_name"]
+        name = c["metric"]["pod"]
         data = c["values"]
 
         dates = [datetime.fromtimestamp(x[0]) for x in data]
@@ -126,17 +150,28 @@
 
 def remove_unwanted_containers(cpus):
     res = []
+    missed = []
     for c in cpus:
-        if "pod_name" in c["metric"]:
+        if "pod" in c["metric"]:
 
-            pod_name = c["metric"]["pod_name"]
+            if c["metric"]["id"].startswith("kubepods", 1):
+                missed.append(c)
+                continue
+
+            if "container" not in c["metric"]:
+                missed.append(c)
+                continue
+
+            pod_name = c["metric"]["pod"]
             container_name = c["metric"]["name"]
 
             if any(x in pod_name for x in EXCLUDED_POD_NAMES):
+                missed.append(c)
                 continue
 
             if "k8s_POD" in container_name:
                 # this is the kubernetes POD controller, we don't care about it
+                missed.append(c)
                 continue
 
             # if "_0" not in container_name:
@@ -146,7 +181,8 @@
             res.append(c)
         else:
             continue
-
+    # print("Found containers: %s" % [c["metric"]["pod"] for c in res])
+    # print("Missed containers: %s" % [c["metric"]["pod"] for c in missed])
     return res
commit	984cf7bc367e106c46ea6d82853129813cd027d1	[log] [tgz]
author	Matteo Scandolo <matteo.scandolo@gmail.com>	Wed Jul 29 13:54:20 2020 -0700
committer	Matteo Scandolo <matteo.scandolo@gmail.com>	Wed Jul 29 13:57:42 2020 -0700
tree	5d2f09de60c238324761538178093809e16149a6
parent	44219d088d30f415794a104e084b702220234cf9 [diff]