YACWC

2025-06-30 14:19:58 -04:00
parent 21b7ccb794
commit c8dbef2c0f
10 changed files with 96383 additions and 48 deletions
--- a/try_decode.py
+++ b/try_decode.py
@@ -1,4 +1,5 @@
 import time
+from datetime import datetime

 import cv2
 import numpy
@@ -12,7 +13,7 @@ import torch
 from cuda import cuda as ccuda
 from cuda import cudart

-cmd = "filesrc location=/home/thebears/local/source/full.mp4 ! qtdemux name=demux demux.video_0 ! queue ! h265parse ! nvv4l2decoder ! nvvidconv ! videoscale method=1 add-borders=false ! video/x-raw,width=1280,height=1280 ! appsink sync=false"
+cmd = "filesrc location=/home/thebears/local/source/short.mp4 ! qtdemux name=demux demux.video_0 ! queue ! h265parse ! nvv4l2decoder ! nvvidconv ! videoscale method=1 add-borders=false ! video/x-raw,width=1280,height=1280 ! appsink sync=false"

 cap = cv2.VideoCapture(cmd, cv2.CAP_GSTREAMER)

@@ -21,6 +22,7 @@ fr = 0


 arrays_to_score = list()
+imgs = list()
 array = list()
 while True:
    good, frf = cap.read()
@@ -31,11 +33,11 @@ while True:


    array.append(frf)
-
+    imgs.append(frf)
    if len(array) > 8:
        arrays_to_score.append(torch.from_numpy(np.asarray(array)))
        array = list()
-        break
+


 if len(array) > 0:
@@ -45,55 +47,84 @@ if len(array) > 0:
 et = time.time()

 print(et - st, fr / (st - et))
+# %%

+from datetime import datetime

+pretrained_name = "webli"
+#model_name = "ViT-L-16-SigLIP2-512"
+model_name = 'ViT-SO400M-16-SigLIP2-512'
+rt_dir ='/home/thebears/local/source/models/'

-
+os.makedirs(rt_dir, exist_ok=True)
+fname = model_name.replace('-','_').lower() + '_'+datetime.now().strftime('%Y%m%d')
+ONNX_FILE_PATH=os.path.join(rt_dir, fname + '.onnx')
+ENGINE_FILE_PATH = os.path.splitext(ONNX_FILE_PATH)[0]+'.engine'

 # %%
-pretrained_name = "webli"
-model_name = "ViT-L-16-SigLIP-512"
-
-
-model_name = 'ViT-SO400M-16-SigLIP2-512'
-ONNX_FILE_PATH = "/home/thebears/local/source/so400m_siglip2_512.onnx"
-#model_name, pretrained_name = ('ViT-B-16-quickgelu', 'openai')

 model, _, preprocess = open_clip.create_model_and_transforms(
    model_name, pretrained=pretrained_name
 )


+# %%
+
+model_gpu = model.cuda()
+scores = list()
+all_means = list()
+with torch.no_grad():
+    for fr_num, img in enumerate(imgs):
+
+        tensor_raw = torch.tensor(img[None,:,:,0:3])
+        tensor_perm = tensor_raw.permute([0, 3, 1, 2]).to(torch.float32) / 255
+        tensor_reshaped = preprocess.transforms[0](tensor_perm)
+        tensor_mean = preprocess.transforms[-1](tensor_reshaped)
+        all_means.append(tensor_mean)
+        imp = model_gpu.encode_image(tensor_mean.cuda())
+
+        print(fr_num)
+        scores.append((fr_num, imp.detach().cpu().numpy()))
+# %%
+np.save('dump_so400m',np.concatenate([x[1] for x in scores]))
+
+
 # %%
 with torch.no_grad():
    et = time.time()
+
    if True:
-        tensor_raw = arrays_to_score[0][0,:,:,0:3][None,:,:,:]
+
+        tensor_raw = torch.concat(arrays_to_score)[0:4, :, :, 0:3]
        tensor_perm = tensor_raw.permute([0, 3, 1, 2]).to(torch.float32) / 255
        tensor_reshaped = preprocess.transforms[0](tensor_perm)
        tensor_mean = preprocess.transforms[-1](tensor_reshaped)
    else:
-        tensor_raw = torch.concat(arrays_to_score)[0:4, :, :, 0:3]
+        tensor_raw = torch.concat(arrays_to_score)[0, :, :, 0:3]
        tensor_perm = tensor_raw.permute([0, 3, 1, 2]).to(torch.float32) / 255
        tensor_reshaped = preprocess.transforms[1](preprocess.transforms[0](tensor_perm))
        tensor_mean = preprocess.transforms[-1](tensor_reshaped)
-    imp = model.encode_image(tensor_mean)
+    #imp = model.encode_image(tensor_mean)
+    imp = model_gpu.encode_image(tensor_mean.cuda())
    st = time.time()
    print((st - et) / tensor_raw.shape[0], tensor_raw.shape[0]/(st - et) )
+    
+from_model_on_gpu = imp.detach().cpu().numpy()
+
+

-    from_model_on_gpu = imp.cpu().numpy()

 # %%

-ENGINE_FILE_PATH = os.path.splitext(ONNX_FILE_PATH)[0]+'.trt'
+
 torch.onnx.export(
-    model.visual,
-    tensor_mean,
+    model.visual.cuda(),
+    tensor_mean.cuda(),
    ONNX_FILE_PATH,
    input_names=["input"],
    output_names=["output"],
 )
-# %%
+
 X_test = tensor_mean.cpu().numpy()
 sess = rt.InferenceSession(
    ONNX_FILE_PATH, providers=rt.get_available_providers())
@@ -106,7 +137,7 @@ def norm(v):

 print(np.dot(norm(pred_onx), norm(from_model_on_gpu).T))

-# %%
+
 TRT_LOGGER = trt.Logger()
 def build_engine_from_onnx(onnx_file_path, use_fp16=True):
    """
@@ -142,7 +173,7 @@ def build_engine_from_onnx(onnx_file_path, use_fp16=True):
    # Enable FP16 precision if requested and if the GPU supports it
    if use_fp16:
        if builder.platform_has_fast_fp16:
-#            config.set_flag(trt.BuilderFlag.FP16)
+            config.set_flag(trt.BuilderFlag.FP16)
            print("FP16 enabled successfully")
        else:
            print("Warning: GPU doesn't support fast FP16, using FP32 instead")
@@ -160,7 +191,7 @@ def build_engine_from_onnx(onnx_file_path, use_fp16=True):



-engine = build_engine_from_onnx(ONNX_FILE_PATH, use_fp16=False)
+engine = build_engine_from_onnx(ONNX_FILE_PATH, use_fp16=True)

 with open(ENGINE_FILE_PATH, "wb") as f:
    f.write(engine)