PublicFreakout.py

# -*- encoding: utf-8 -*-

from configparser import ConfigParser
from json import load, dump
from os import getpid, listdir, remove, path, makedirs, rename
from prawcore.exceptions import RequestException, ServerError
from time import sleep, ctime, time
from requests import get
from boto3 import session
from botocore.client import Config

import praw.models
import re
import subprocess
import youtube_dl
import os
import simplejson as json
import requests
import multiprocessing
import urllib.parse
import boto3
import praw
import magic

print(getpid())

# Empty youtube logger
class MyLogger():
    def debug(self, msg):
        pass

    def warning(self, msg):
        pass

    def error(self, msg):
        pass

config = ConfigParser()
config.read("config.ini")

reddit = praw.Reddit(**config["Reddit"])
do_access_id = config["DigitalOcean"]["access_id"]
do_secret_key = config["DigitalOcean"]["secret_key"]

ydl_opts = {
    'format': 'best[ext=mp4]/bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext=mp4]/best',
    'logger': MyLogger(),
    'outtmpl': "Media/%(id)s.mp4",
}

yt = youtube_dl.YoutubeDL(ydl_opts)
session = session.Session()

try:
    with open("saved_links.txt") as file:
        # Load hash file and only keep most recent 28 days
        saved_links = [n for n in load(file) if n["created"] > time() - 3600 * 24 * 28]
except FileNotFoundError:
    with open("saved_links.txt", "w") as file:
        saved_links = []
        dump(saved_links, file)


def check_links(submission):
    mirror_list = []

    if saved_links:
        while saved_links[0]["created"] < time() - 3600 * 24 * 28:
            saved_links.pop(0)

    for data in saved_links:
        if data["video_url"] == submission.url:
            mirror_url = data["mirror_url"]


            if data["mirror_url"]:
                if not ("error" or "supplied") in str(mirror_url):
                    for x in mirror_url.split():
                        mirror_list.append(x.replace("'","").replace("[","").replace("]","").replace(",",""))
                    
                    reply_reddit(submission, mirror_list)
            
            return save("Repost", submission, mirror_list)

def cleanup():
    print("Cleanup")
    if not path.exists("Media"):
        makedirs("Media")

    for file in listdir("Media"):
        remove("Media/" + file)

def combine_media():
    command = [
        "ffmpeg",
        "-v", "quiet",
        "-i", "Media/video",
        "-i", "Media/audio",
        "-c", "copy",
        "-f", "mp4",
        "Media/output.mp4",
        "-y"
    ]

    subprocess.run(command)

def download(filename, url):
    with open("Media/" + filename, "wb") as file:
        file.write(get(url).content)            

def process(submission):
    print("process() entered")
    print("Got next post: ", submission.title, " ", "https://reddit.com" + submission.permalink)
    #Don't wanna mirror nazi propaganda
    if "Antifa" in submission.title or "antifa" in submission.title:
        return
    mirror_url = None

    
    print("VIDEO URL: "+ submission.url)

    # Twitter post
    if "twitter" in submission.url:
        print("TWEETER VIDEO")
        
        try:
            response = yt.extract_info(submission.url, process=False)
            while response.get("url"):
                response = yt.extract_info(response["url"], process=False)
        
        except youtube_dl.utils.DownloadError:
            return save("Twitter download error", submission)
            

        submission.url = response["webpage_url"]

    # Reddit hosted video
    if submission.domain == "v.redd.it":
        print("LEDDIT VIDEO")
        # If post is crosspost, set submission to linked post
        if submission.media is None:
            if hasattr(submission, "crosspost_parent"):
                submission.media = reddit.submission(submission.crosspost_parent[3:]).media
            else:
                url = get(submission.url).url
                _id = praw.models.reddit.submission.Submission.id_from_url(url)
                submission.media = reddit.submission(_id).media

        video_url = submission.media["reddit_video"]["fallback_url"]
        download("video", video_url)
        
        audio_url = video_url.rsplit("/", 1)[0] + "/audio"
        download("audio", audio_url)

        if submission.media["reddit_video"]["is_gif"]:
            mirror_url = upload("Media/video", submission.id)
            status = "Complete"
            print("Mirror url: " + str(mirror_url))
        
        #if not gif but still no audio
        elif not 'octet-stream' in magic.Magic(mime=True,uncompress=True).from_file('Media/audio'):
            mirror_url = upload("Media/video", submission.id)
            status = "Complete"
            print("Mirror url: " + str(mirror_url))
        
        #audio exists
        else:
            combine_media()
            
            mirror_url = upload("Media/output.mp4", submission.id)
            status = "Complete"
            print("Mirror url: " + str(mirror_url))

        

        if status == "Complete":
            reply_reddit(submission, mirror_url)
            return save(status, submission, mirror_url)
        
    #download video
    try:
        yt.download([submission.url])
    except (youtube_dl.utils.DownloadError) as e:
        print(str(e))
        return save(str(e), submission, "Download error")
    except (youtube_dl.utils.SameFileError) as e:
        print(str(e))
        return save(str(e), submission, "Same file error")
    except (UnicodeDecodeError) as e:
        print(str(e))
        return save(str(e), submission, "UnicodeDecodeError")  
    except (TypeError) as e:
        return save(str(e), submission, "TypeError")

    if listdir("Media") == []:
        return save("Download failed", submission, "Media folder empty")

    file = [i for i in listdir("Media")][0]
    file = "Media/" + str(file)
    mirror_url = upload(file, submission.id)
    if "NOT_HTTP: " in mirror_url:
        print("NOT HTTP")
        return
    else:
        status = "Complete"
        print("Mirror url: " + str(mirror_url))
        reply_reddit(submission, mirror_url)
        return save(status, submission, mirror_url)
     
    # Should never be called
    save("End", submission)            

def reply_reddit(submission, mirror_url):
    print("Submitting comment...")
    while True:
        if not mirror_url:
            return
        try:
            mirror_text = ""
            mirror_text += "[Mirror](http://mirrorbot.ga" + submission.permalink + ") \n\n".format(urllib.parse.quote(str(mirror_url), safe=''))
            comment = submission.reply(" | ".join([
                mirror_text + "  \nI am a bot",
                "[Feedback](https://www.reddit.com/message/compose/?to={[Reddit][host_account]}&subject=PublicFreakout%20Mirror%20Bot)".format(config),
                "[Github](https://github.com/dopeslothe/PublicFreakout-Mirror-Bot) "
            ]))
            comment.mod.approve()
            comment.mod.distinguish(how='yes',sticky=True)
            break
        
        except praw.exceptions.APIException:
            print("Rate limit exception")
            sleep(60)
            continue

def run():
    while True:
        stream = reddit.subreddit("PublicFreakout").stream.submissions(pause_after=1)

        try:
            checked = [n._extract_submission_id() for n in reddit.user.me().comments.new()]
        except RequestException:
            sleep(60)
            continue

        while True:
            cleanup()

            try:
                # Get next post
                submission = next(stream)
            except RequestException:
                # Client side error
                sleep(60)
            except ServerError:
                # Reddit side error
                sleep(60)
            except StopIteration:
                break
            else:
                if submission is None:
                    print("No new posts.")
                    continue

                if submission.is_self:
                    print("Skipping self-post.")
                    continue

                # Don't bother creating mirror for posts over a day old
                if submission.created_utc < time() - 3600 * 24 * 1:
                    print("Submission is too old")
                    continue

                if submission in checked:
                    print("Submission already mirrored")
                    continue

                try:
                    process(submission)
                except PermissionError:
                    return "Permission denied"

            cleanup()

def save_file_size(file_name):
    with open("file_sizes.txt", "a") as file:
        out = str(ctime()) + ": " + str(os.path.getsize(file_name)) + "\n"
        file.write(out)


def save(status, submission, mirror_url=None):
    if not mirror_url:
        print("Unable to save to file: No url supplied")
        return
    text = "{:<19} | " + ctime() + " | https://www.reddit.com{:<85} | {}\n"
    permalink = submission.permalink.encode("ascii", "ignore").decode()

    with open("mirror_bot_log.txt", "a") as file:
        file.write(text.format(status, permalink, " | " + str(mirror_url)))

    saved_links.append({
        "created": int(submission.created_utc),
        "reddit": "https://www.reddit.com" + permalink,
        "video_url": submission.url,
        "mirror_url": str(mirror_url)
    })

    while saved_links[0]["created"] < time() - 3600 * 24 * 28:
        saved_links.pop(0)

    with open("saved_links.txt", "w") as file:
        dump(saved_links, file, indent=4, sort_keys=True)

    return True

#new upload function, doesn't use limf
#uploads to given pomf.se clone

def upload(file_name, submission_id):
    file_name = conv_to_mp4(file_name)
    save_file_size(file_name)
    print("Size:", str(os.path.getsize(file_name)/1024/1024) + "MB")
    output_file = "/var/www/html/media/" + str(submission_id) + ".mp4"
    rename(file_name, output_file)

    mirror_url = "https://mirrorbot.ga/media/" + str(submission_id) + ".mp4"
    
    print("Upload complete!")
    return str(mirror_url)



#old upload
#def upload(file_name, submission_id):
    #file_name = conv_to_mp4(file_name)
    #print("Uploading to DO...")
    #save_file_size(file_name)
    #print("Size:", str(os.path.getsize(file_name)/1024/1024) + "MB")
    #client = session.client('s3',
        #region_name='nyc3',
        #endpoint_url="https://pf-mirror-1.nyc3.digitaloceanspaces.com",
        #aws_access_key_id=do_access_id,
        #aws_secret_access_key=do_secret_key)
    #key = str(submission_id) + ".mp4"

    #client.upload_file(file_name, 'videos', key)
    
    #resource = boto3.resource('s3',
        #region_name='nyc3',
        #endpoint_url="https://pf-mirror-1.nyc3.digitaloceanspaces.com",
        #aws_access_key_id=do_access_id,
        #aws_secret_access_key=do_secret_key)

    #print(key)
    #client.put_object_acl(ACL='public-read', Bucket='videos', Key=key)
    #key = "videos/" + key
    #mirror_url = "https://pf-mirror-1.nyc3.digitaloceanspaces.com/" + key
    
    #print("Upload complete!")
    #return str(mirror_url)
        
#converts given file to mp4, and returns new filename
def conv_to_mp4(file_name):
    
    vid_name = file_name[:-4] + ".mp4"
    
    ##check if file is mkv and convert to mp4
    if ".mkv" in file_name:
        ffmpeg_subproc = [
            "ffmpeg",
            "-i", file_name,
            "-strict", "-2", #fixes opus experimental error
            "-vcodec", "copy",
            "-y",
            vid_name
            ]
        conv_process = subprocess.run(ffmpeg_subproc)
        return vid_name

    else:
        return file_name

if __name__ == "__main__":
    if path.exists("/usr/bin/ffmpeg"):
        print(run())
    else:
        print("Needs ffmpeg")