6 changed files with 0 additions and 207 deletions
--- a/.gitignore
+++ b/.gitignore
@ -1,5 +1 @@
 env/
 files/
 __pycache__/
 *.tar.gz
 *.log
--- a/BIN
+++ b/BIN
--- a/main.py
+++ b/main.py
@ -1,6 +0,0 @@
 from pir_connector import *
 # getCollection("https://www.partnersinrhyme.com/royaltyfreemusic/Corporate-Music-and-Motivational-Music/happymusic")
 # getCollection("https://www.partnersinrhyme.com/royaltyfreemusic/Corporate-Music-and-Motivational-Music/Corporate-Grooves-Vol-2")
 getCategory("https://www.partnersinrhyme.com/royaltyfreemusic/Corporate-Music-and-Motivational-Music")
--- a/main_example.py
+++ b/main_example.py
@ -1,108 +0,0 @@
 import requests
 import json
 import os
 from bs4 import BeautifulSoup
 baseurl = "https://bvtlab.com"
 phpsessid = "lps4od32b4kgibtgd1440df7i5"
 sid = "b88e922dd251e1f6"
 time = "6535904988"
 reqcookies = dict(PHPSESSID=phpsessid)
 def getImageName(imageURL):
    result = ""
    for char in imageURL:
        result += char
        if char == "/":
            result = ""
    return result
 def downloadImage(imageURL, outDir, outFile):
    i = requests.get(imageURL)
    if not os.path.exists(outDir):
        os.makedirs(outDir)
    with open(os.path.join(outDir, outFile), 'wb') as tempFile:
        tempFile.write(i.content)
 def getSegments():
    payload = {
        "action": "getsegments",
        "sid": sid,
    }
    r = requests.get(baseurl + "/ebook.php", params=payload, cookies=reqcookies)
    items = r.json()
    result = []
    for i in range(0, len(items)):
        if items[i]["Section"] == None:
            #print(i+1, items[i]["Title"], items[i]["Short_Title"])
            result.append([i+1, items[i]["Level1"], items[i]["Segment_Depth"], items[i]["Segment_Level"], items[i]["Line_Item"], items[i]["Short_Title"], items[i]["Title"]])
    return result
 def getPages(seg, lev, seg_dep, seg_lev, li):
    payload = {
        "action": "getpages",
        "sid": sid,
        "segment": seg,
        "level": lev,
        "segment_depth": seg_dep,
        "segment_level": seg_lev,
        "line_item": li,
        "width": 550
    }
    r = requests.get(baseurl + "/ebook.php", params=payload, cookies=reqcookies)
    soup = BeautifulSoup(r.text, 'html.parser')
    return soup.find_all("div")
 def ripPages(divlist, dir, pdf):
    for d in divlist:
        pagenum = d["data-page"]
        imgs = d.find_all("img")
        print(pagenum, "----", d)
        width = 1100
        height = 1491
        stichedIm = Image.new('RGB', (width, height))
        ih = 0
        for im in imgs:
            print(im)
            imurl = im["data-src"]
            downloadImage(imurl, dir + "/page_" + pagenum, im["id"] + ".jpg")
            im = Image.open(os.path.join(dir + "/page_" + pagenum, im["id"] + ".jpg"))
            print(im.size)
            #height += im.size[1]
            stichedIm.paste(im, (0, im.size[1] * ih))
            ih += 1
        stichedIm.save(dir + "/page_"+ pagenum + ".jpg")
        pdf.add_page()
        pdf.image(dir + "/page_"+ pagenum + ".jpg", 0, 0)
        print("the height:", width, height)
 chapters = getSegments()
 pdf = FPDF(unit = "pt", format = [1100, 1491])
 for x in range(0, len(chapters)):
    s = getPages(chapters[x][0], chapters[x][1], chapters[x][2], chapters[x][3], chapters[x][4])
    outdir = chapters[x][5] + "_" + chapters[x][6]
    ripPages(s, outdir, pdf)
 pdf.output("ebook.pdf", "F")
--- a/pir_connector.py
+++ b/pir_connector.py
@ -1,81 +0,0 @@
 import requests
 import json
 import os
 import re
 import time
 from bs4 import BeautifulSoup
 from selenium import webdriver
 from selenium.webdriver.common.by import By
 from selenium.webdriver.common.keys import Keys
 from selenium.webdriver.support.ui import WebDriverWait
 from selenium.webdriver.support.expected_conditions import presence_of_element_located
 from selenium.webdriver.firefox.options import Options
 options = Options()
 options.headless = True
 base_url = "https://www.partnersinrhyme.com/royaltyfreemusic"
 base_files_url = "https://www.partnersinrhyme.com/files/"
 base_out_url = "files/PartnersInRhyme/"
 def getCategory(category_url):
    r = requests.get(category_url)
    soup = BeautifulSoup(r.text, 'html.parser')
    category_name = category_url.split("/")[-1]
    links = set();
    for li in soup.find_all(href=re.compile(category_name+ "/")):
        links.add(li['href'])
    for lk in links:
        print(lk)
        getCollection(lk, category_name)
 def getCollection(collection_url, category_name):
    r = requests.get(collection_url)
    soup = BeautifulSoup(r.text, 'html.parser')
    player = soup.iframe["src"];
    p = requests.get("http:" + player);
    with webdriver.Firefox(options=options) as driver:
        driver.get("http:" + player)
        el = WebDriverWait(driver, 60).until(f)
        time.sleep(2)
        psoup = BeautifulSoup(driver.page_source, 'html.parser')
        # print(psoup)
        driver.quit()
        for li in psoup.find_all("li"):
            try:
                print("downloading...", li.attrs['data-mp3'])
                downloadSong(base_files_url + li.attrs['data-mp3'], category_name)
            except KeyError:
                print("Could not load", collection_url.split("/")[-1], "possibly has hiearchy")
 def downloadSong(song_url, category_name):
    (collection_name, outFile) = getSongFromURL(song_url);
    outDir = base_out_url + category_name + "/" + collection_name
    if not os.path.exists(outDir):
        os.makedirs(outDir)
    if not os.path.isfile(os.path.join(outDir, outFile)):
        i = requests.get(song_url)
        with open(os.path.join(outDir, outFile), 'wb') as tempFile:
            tempFile.write(i.content)
    else:
        print("File", outFile, "already exists... skipping")
    print("")
 def getSongFromURL(song_url):
    list = song_url.split("/")
    return (list[4], list[-1])
 def f(d):
    return d.find_element_by_class_name("listContainer")
--- a/requirements.txt
+++ b/requirements.txt
@ -1,8 +0,0 @@
 beautifulsoup4==4.7.1
 certifi==2018.11.29
 chardet==3.0.4
 idna==2.8
 requests==2.21.0
 selenium==3.141.0
 soupsieve==1.7.1
 urllib3==1.24.1